에임인텔리전스, 10개국 AI 안전성 벤치마크 공개

에임인텔리전스, 10개국 AI 안전성 벤치마크 공개.png

AI 보안 전문기업 에임인텔리전스가 대규모 언어모델(LLM)의 현지 맥락 이해도를 평가하는 글로벌 벤치마크를 공개했다.

새로 내놓은 평가 지표의 이름은 'XL-SafetyBench'다. 평가 대상은 한국과 미국, 인도, 인도네시아, 프랑스, 독일, 스페인, 아랍에미리트(UAE) 등 10개국이다. 회사는 이들 국가의 환경에 맞춘 5500개의 현지화 테스트 케이스를 짰다. 이를 바탕으로 시중에 쓰이는 37개 주요 LLM의 안전성을 직접 비교했다.

핵심은 단순한 언어 필터링 너머를 검증하는 데 있다. 기존 안전성 평가는 대개 유해한 답변을 기계적으로 차단하는 수준에 머물렀다. 반면 이번 지표는 모델이 각국의 법과 제도, 지역 특유의 사기 유형, 문화적 민감성을 실제로 인지하고 작동하는지를 들여다본다.

생성형 AI가 글로벌 서비스로 빠르게 퍼져나가면서 불거진 맹점을 파고들었다. 국가마다 허용되는 발언의 수위나 불법의 기준이 다르다. 현지 리스크를 꼼꼼히 반영한 평가 잣대가 필요하다는 기업들의 현장 수요가 꾸준히 제기돼 왔다.

관련 논문과 데이터셋은 각각 글로벌 오픈액세스 플랫폼 아카이브(arXiv)와 허깅페이스에 열어뒀다. 평가 체계 확장을 위해 글로벌 연구진과 기업들이 언제든 접근해 기술 검증에 활용하도록 했다.

에임인텔리전스, 10개국 AI 안전성 벤치마크 공개

댓글 작성

댓글

관련 기사

문샷AI, 2.8조 파라미터 ‘키미 K3’ 출시…오픈웨이트 AI 경쟁 가속

노타, ICML 2026 최적화 챌린지 3위…LLM 추론 속도 6.978배 향상

그립컴퍼니, 중국 하이닝시와 라이브커머스 협력 추진

농식품테크 스타트업 20곳, GMEP 데모데이서 아시아 진출 전략 발표

후커블, 스마일게이트인베스트먼트서 시드 브릿지 투자 유치

프라이빗테크놀로지, ‘프라이빗에이아이’로 사명 변경

중기부, 방산 스타트업 챌린지 2차 참가기업 모집

한국딥러닝, 상반기 문서 AI 매출 3.4배 성장…금융·공공 온프레미스 수요 견인

토프모빌리티, K-UAM CONFEX서 AI 운항 플랫폼 공개

트래블월렛 일본 서비스 정식 출시하며 글로벌 결제 인프라 확장

키뮤스튜디오·유진투자증권, 5년 ESG 협력 성과 공개

많이 본 뉴스

기후테크 스타트업 협단체 그린테크얼라이언스 공식 출범

블루닷에이아이, AI 검색 내 브랜드 누락 자동 진단·대응 기능 출시

콘진원 'K-콘텐츠 스타트업 워킹그룹' 가동… 지원 정책 전면 재설계

중기부 '모두의 챌린지 AX' 출범… AI 스타트업 48개사 육성

MYSC·농업기술진흥원 농산업 스타트업 10개사 육성 착수