https://www.technologyreview.kr/ai-large-language-models-bigscience-project/
현재 상황
- 구글 IO에서 발표한 람다(LaMDA), MS에서 독점 라이센스를 구매한 GPT-3, 페이스북에서 번역 및 콘텐츠 관리용 자체적으로 개발한 LLM(Large Language Model) 등 거대 기업들에서 각자의 초대형 NLP Model들을 개발 중
- 각자 비공개적으로 만들고 있는 모델들이 실생활에 활용될 때, LLM의 결함이 사람들에게 어떤 영향을 미치는지, 어떤 문제가 있고 그걸 해결 할 수 있는 지에 대한 연구는 전무한 상황.
- 지난 12월 구글은 윤리적 AI(Ethical AI) 부서의 공동 팀장 팀닛 게브루(Timnit Gebru)를 해고 되면서 문제가 더 심화됨
새로운 시도를
- 허깅페이스(Huggingface)가 이끄는 빅사이언스(BigScience) 프로젝트에 전 세계에서 500명이 넘는 연구자들이 모여 오픈소스 LLM을 구축하기 위해 박차를 가하고 있다.
- 슈퍼컴퓨터의 생애주기 비용(life-cycle costs)을 고려하여 모델의 훈련과 운용에 따른 탄소발자국을 포함한 LLM의 환경 영향을 측정하는 실무그룹
- 어떻게 하면 책임 있는 방식으로 훈련 데이터를 확보할 수 있을지를 고민하는 실무그룹
언어를 감지 갈리시아어 구자라트어 그루지야어 그리스어 네덜란드어 네팔어 노르웨이어 덴마크어 독일어 라오어 라트비아어 라틴어 러시아어 루마니아어 룩셈부르크어 리투아니아어 마라티어 마오리어 마케도니아어 말라가시어 말라얄람어 말레이어 몰타어 몽골어 몽족 미얀마어 (버마어) 바스크어 베트남어 벨로루시어 벵골의 보스니아어 불가리아어 사모아어 세르비아어 세부아노 세소토어 소말리아어 쇼나어 순다어 스와힐리어 스웨덴어 스코틀랜드 게일어 스페인어 슬로바키아어 슬로베니아어 신디어 신할라어 아랍어 아르메니아어 아이슬란드어 아이티 프랑스 말 아일랜드어 아제르바이잔어 아프리칸스어 알바니아어 암하라어 에스토니아어 에스페란토 말 영어 요루바어 우르두어 우즈베크어 우크라이나어 웨일즈어 이그보어 이디시어 이탈리아어 인도네시아어 일본어 자바어 줄루어 중국어(간체) 중국어(번체) 체와어 체코어 카자흐어 카탈로니아어 칸나다어 코르시카어 코사어 쿠르드어 크로아티아어 크메르어 키르기스어 타갈로그어 타밀어 타직어 태국어 터키어 텔루구어 파슈토어 펀자브어 페르시아어 포르투갈어 폴란드어 프랑스어 프리지아어 핀란드어 하와이 사람 하우사어 한국어 헝가리어 히브리어 힌디어
갈리시아어 구자라트어 그루지야어 그리스어 네덜란드어 네팔어 노르웨이어 덴마크어 독일어 라오어 라트비아어 라틴어 러시아어 루마니아어 룩셈부르크어 리투아니아어 마라티어 마오리어 마케도니아어 말라가시어 말라얄람어 말레이어 몰타어 몽골어 몽족 미얀마어 (버마어) 바스크어 베트남어 벨로루시어 벵골의 보스니아어 불가리아어 사모아어 세르비아어 세부아노 세소토어 소말리아어 쇼나어 순다어 스와힐리어 스웨덴어 스코틀랜드 게일어 스페인어 슬로바키아어 슬로베니아어 신디어 신할라어 아랍어 아르메니아어 아이슬란드어 아이티 프랑스 말 아일랜드어 아제르바이잔어 아프리칸스어 알바니아어 암하라어 에스토니아어 에스페란토 말 영어 요루바어 우르두어 우즈베크어 우크라이나어 웨일즈어 이그보어 이디시어 이탈리아어 인도네시아어 일본어 자바어 줄루어 중국어(간체) 중국어(번체) 체와어 체코어 카자흐어 카탈로니아어 칸나다어 코르시카어 코사어 쿠르드어 크로아티아어 크메르어 키르기스어 타갈로그어 타밀어 타직어 태국어 터키어 텔루구어 파슈토어 펀자브어 페르시아어 포르투갈어 폴란드어 프랑스어 프리지아어 핀란드어 하와이 사람 하우사어 한국어 헝가리어 히브리어 힌디어
음성 기능은 200자로 제한됨