Char :: 자연어처리 (NLP)

자연어처리 (NLP) - SpanBERT

07.AI 2023. 5. 15. 15:15

728x90

SpanBERT는 2019년 7월 워싱턴대, 프린스턴대, AllenAI 연구소, 페이스북에서 수행한 연구이다[11]. SpanBERT의 주요 개선 내용은 Span Masking, Span Boundary Objective, Single-sequence training의 세 가지이다.

첫 번째, Span masking은 BERT에서 각 토큰에 대해서 개별적으로 [MASK] 토큰을 변환한 것과 달리, 연속된 span 단위로 각 토큰에 대해서 [MASK] 토큰을 변환하였다. 연속된 span은 각 토큰에 대해 베르누이 트라이얼(Bernoulli trials)을 연속적으로 수행하였을 경우의 geometric distribution(p=0.2)을 사용하여 마스킹을 수행하였으며, 총 마스킹 토큰은 전체 토큰 수의 15%를 동일하게 사용하였다.

두 번째, Span Boundary Objective는 [MASK]로 변환된 단어의 원 단어 토큰을 추론할 때, 해당 단어의 출력 벡터로부터 추론하는 loss 외에 span의 경계에 위치한 단어의 출력 벡터로부터 해당 단어를 추론하는 loss를 추가하여 학습한 것이다. 그림 3을 살펴보면, 7번째 단어가 football일 때, x7 출력 토큰을 이용하여 football을 예측하는 loss와 span의 경계에 해당하는 x4 및 x9와 해당 단어의 위치인 p7을 이용하여 football을 예측하는 loss를 결합하여 사용한다.

https://ettrends.etri.re.kr/ettrends/183/0905183002/0905183002.html#!po=10.0000

딥러닝 사전학습 언어모델 기술 동향

딥러닝 사전학습 언어모델 기술 동향 Recent R&D Trends for Pretrained Language Model 임준호 (Lim J.H.) 김현기 (Kim H.K.) 김영길 (Kim Y.K.) Keywords: 딥러닝 사전학습 언어모델, BERT, RoBERTa, ALBERT, BART, ELECTRA, KorBERT

ettrends.etri.re.kr

728x90

저작자표시

'07.AI' 카테고리의 다른 글

인공지능 - 윤리- AI윤리 국가표준(KS) (0)	2023.06.22
자연어처리 (NLP) - ALBERT (0)	2023.05.15
자연어처리 (NLP) - FastText (0)	2023.05.15
자연어처리 (NLP) - RoBERTa (0)	2023.05.15
자연어처리 (NLP) - NPML (0)	2023.05.15

Posted by Mr. Slumber

Char

자연어처리 (NLP) - SpanBERT

'07.AI' 카테고리의 다른 글

카테고리

태그목록

최근에 올라온 글

최근에 달린 댓글

글 보관함

달력

링크

티스토리툴바

« 2025/02 »
일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28