KT가 31일 매개변수(패러미터) 최대 2000억 개 수준의 초거대 인공지능(AI) '믿음'(Mi:dm)을 선보였다. KT는 이날 서울 서초구 KT 연구개발센터에서 기자설명회를 열어 국내 최초로 1조 토큰(데이터에서 의미를 가지는 최소한의 덩어리) 이상 데이터를 학습한 거대언어모델(LLM) '믿음'을 정식 공개했다. '믿음' 출시 모델은 매개변수 70억 개 수준의 '경량'부터 거대언어모델 'GPT-3'(1750억 개)보다 매개변수가 250억 개 이상 많은 '초대형'까지 4종으로 분류됐다. 이 중 외부에 완전히 개방한 경량 모델의 경우 AI 스타트업 '업스테이지'와 한국지능정보사회진흥원(NIA)이 개발한 거대언어모델 평가 플랫폼 '오픈 코-LLM 리더보드'에서 최상위권에 들기도 했다. KT는 기업 규모와 사용 목적에 맞게 완전 맞춤형으로 사용할 수 있도록 '믿음'의 기반 모델(파운데이션 모델)을 개방했으며, 'KT 믿음 스튜디오'라는 전용 포털에서 직접 모델을 선택하고 학습할 수 있도록 환경을 구축했다. 난제로 꼽히는 '환각 현상'(할루시네이션) 해결에도 공을 들였다. KT는 '믿음'에 도식화되고 복잡한 문서를 정확히 이해하도록 돕는 '다큐먼트 AI', 목표
팔로알토 네트웍스의 위협 연구 기관 유닛42(Unit42)는 챗GPT 관련 스캠 사기가 급증하는 추세라며 각별한 주의가 필요하다고 4일 밝혔다. 유닛42 조사에 따르면 지난해 11월부터 올해 4월까지 등록된 챗GPT 관련 도메인이 910% 증가했으며, 팔로알토 네트웍스의 고급URL 필터링 시스템에서 트래픽 모니터링을 실시한 결과 매일 100개 이상의 ChatGPT 관련 악성 URL이 탐지됐다. 같은 기간 내 DNS 보안 로그 분석으로는 도메인에 'openai'와 'chatgpt' 등의 관련 키워드를 넣어 이를 악성 행위에 사용하는 스쿼팅 도메인이 1만8000% 증가한 것으로 나타났다. 챗GPT 관련 스쿼팅 도메인은 최초 공개된 이후 꾸준히 등록됐으며 특히 2월 7일 새로운 빙(Bing) 버전 출시 이후에는 300개 이상의 도메인이 등록됐다. 고급 URL 필터링 시스템을 통해 실시한 키워드 검색에서는 공식 API 릴리즈와 GPT-4 출시 기간에 특히 급증했다. 유닛42는 이와 함께 오픈API 공식 사이트와 유사하게 제작된 다수의 피싱 URL이 존재한다고 밝혔다. 이러한 모방 사이트를 방문하는 사용자들을 속여 악성 프로그램을 다운로드 하거나 중요 정보를 탈취하기
향후 수업 추천, 진행, 에러 메시지 해석 활용 계획… 프로 플랜도 출시 예정 AI 기반 디지털 교육 기업 엘리스가 GPT-3를 기반으로 코딩 학습을 돕는 ‘AI 헬피’를 출시했다고 23일 밝혔다. AI 헬피는 엘리스 플랫폼 내 질의응답을 할 수 있는 ‘헬프 센터’에서 학습자를 위해 코드를 풀어서 설명해주거나 오류를 잡아 수정을 돕는 코딩 학습 보조 AI 챗봇으로, GPT-3 기반의 대형 언어모델(LLM) 활용해 코드를 간결하게 정리해주거나 다른 프로그래밍 언어로 번역하는 기능을 갖췄다. AI 헬피는 엘리스가 자체 보유한 약 15만 건의 질의응답과 4억 개 이상의 텍스트 토큰을 활용해 성능을 높였고, 사전학습된 머신러닝(기계학습) 모델을 미세조정(fine-tuning)하는 과정을 거쳐 코딩 관련 질의응답에 최적화했다. 그 결과, 학습자는 질문하고 싶은 부분의 코드를 드래그해 바로 문의할 수 있는 간편하게 사용할 수 있다. 실제로 엘리스 헬프 센터는 AI 헬피를 통해 평균 20분이 소요되던 답변 시간이 1분으로 감소했다. 또한 AI 헬피는 컴퓨터 공학 분야 초보 학습자들이 질문을 더 잘 할 수 있도록 돕는다. 실제로 LLM을 이용해 문제 풀이 시 모델에 적정한
헬로티 함수미 기자 | 한국전자통신연구원(ETRI)이 사람처럼 똑똑하게 문서를 이해하고 원하는 정보를 찾을 수 있는 기술을 개발했다고 밝혔다. 국내 연구진이 오피스 문서로부터 사용자의 질문에 정답을 알려주고, 두 문장이 같은 의미인지 이해하는 API 2종을 개발했다. 이로써 필요한 내용을 빠르게 파악해 업무 생산성을 높이고 정보 공유와 활용도를 대폭 높이는 데 큰 도움이 될 전망이다. 본 기술은 ETRI 공공 인공지능 오픈 API·데이터 서비스 포털에 공개돼 누구나 쉽게 이용할 수 있다. 현대 조직에서는 다양한 업무 관련 정보와 지식들을 전자문서 형태로 만들고 있다. 정보들은 홈페이지나 그룹웨어에 저장되어 있지만, 게시물 제목과 파일 이름에 포함된 단어로 검색하고 일일이 문서를 열어보며 원하는 내용을 찾아야 하기에 검색 효율성이 떨어졌다. ETRI는 인공지능 SW를 이용해 원하는 정보를 검색할 수 있을 뿐 아니라 사용자가 하는 질문에 정답과 근거까지 확인할 수 있는 기술을 개발했다. 먼저 행정문서 질의응답 API 기술은 딥러닝 언어모델을 이용해 단락과 표를 인식하여 정답 및 근거 문장을 인식하는 기술이다. 예를 들어 ‘출장 경비가 100만 원 들 때, 결재를