네이버 큐:와 MS 빙 코파일럿
[홈페이지 캡처. 재판매 및 DB 금지]
조현영 기자 = 한국 인터넷 사용자는 네이버의 생성형 인공지능(AI) 검색 서비스 '큐:'(CUE:)에 더 큰 감정적인 만족감을 느끼면서, 검색 속도 측면에서는 마이크로소프트(MS) '빙(Bing) 코파일럿'을 더 우수하다고 느끼는 것으로 나타났다.
3일 이정진 숭실대 글로벌미디어학부 조교수 연구팀은 디지털콘텐츠학회논문지에 이 같은 내용의 논문을 실었다.
사용자가 키워드를 입력하면 검색 엔진이 해당 키워드와 일치하는 정보를 기반으로 결과를 도출하는 방식의 기존 검색과는 달리, AI 검색 서비스는 사용자와 문답을 통해 맞춤형 정보를 제공해 주목받는다.
네이버 큐는 네이버의 AI 모델 하이퍼클로바X 기반 검색 특화 서비스고, 빙은 마이크로소프트의 AI 어시스턴트 코파일럿 기반 서비스다.
연구팀은 20대 이상 참가자 25명을 대상으로 1시간 동안 뉴스, 쇼핑, 여행 관련 임무를 수행하게 했다.
한 주제에 대한 임무가 끝날 때마다 인터뷰를 진행해 어떤 감정과 불편함을 느꼈는지 파악했고 모든 임무가 끝난 후에는 설문조사를 진행했다.
조사 항목은 사용성, 유용성, 신뢰성, 매력성, 윤리성이었다.
사용성은 서비스 이용이 편리한지 평가하는 요소이고 유용성은 사용자 요구를 충족하는지 평가하는 지표다. 신뢰성은 답변이 믿을 수 있는지를, 매력성은 사용자가 감정적으로 만족하거나 즐거움을 느끼는지 평가하는 요소다. 윤리성은 AI 답변이 사회적 가치를 위협하거나 유해한 질문을 거부하는지를 나타낸다.
인터뷰 결과, 전반적으로 네이버 큐는 한국어에 최적화돼 내용 이해에 용이하고 검색 결과 도출 과정을 보여줘 친절하다는 평가를 받았다.
네이버 큐: 검색 결과 도출 과정
[홈페이지 캡처. 재판매 및 DB 금지]
그러나 많은 글자로 인한 가독성 저하와 여러 번 질문해야 한다는 점이 단점으로 지적됐다.
빙 코파일럿은 구조화된 답변과 빠른 검색 속도가 장점으로 꼽혔지만, 어색한 번역체, 좁은 글씨 간격과 글씨체로 인해 가독성이 떨어졌다.
유용성 측면에서는 큐가 네이버 쇼핑 링크, 유튜브 링크 등을 추가 제공해 좋은 평가를 받았지만, 기존 정보를 그대로 가져오는 경향이 있어 정보 깊이가 낮다는 느낌을 줬다.
빙 코파일럿은 예상치 못한 유용한 답변을 제공했지만, 중복 답변을 제공하는 점은 불편하다고 평가받았다.
신뢰성과 관련해 큐는 출처를 명확히 표기해 신뢰성을 높였지만, 맥락에 맞지 않는 답변을 하거나 광고성 정보로 느껴지는 블로그 링크를 제공하는 점이 신뢰도를 다소 떨어뜨렸다.
예컨대 멕시코 현지 맛집을 검색했는데 국내 멕시코 음식점을 추천하거나, 20대 남성 향수 추천을 요청했더니 20대 여성용 향수가 답변에 포함된 경우가 있었다고 연구팀은 설명했다.
빙 코파일럿은 최신 정보가 아닌 링크를 제공하는 경우 신뢰성이 떨어진다는 의견이 있었다.
한편 큐는 자연스러운 한국어와 깔끔한 디자인으로 매력성 측면에서 긍정적인 평가를 받았지만, AI가 사람을 모방하는 느낌이 들어 불쾌하다는 의견이 있었다.
빙 코파일럿은 친근한 말투는 장점이지만, 한국어 문법의 어색함과 디자인 부족이 단점으로 지적됐다.
다만 네이버 큐는 아직 베타 서비스 단계인 만큼 피드백을 통해 정식 버전에서는 단점이 보완될 것으로 예측된다.
설문조사 결과에서는 매력성 측면에서만 유의미한 차이가 있었다.
연구팀은 이 차이가 네이버 UI 디자인과 폰트가 한국인에게 익숙하기 때문인 것으로 분석했다.
연구팀은 논문에서 "큐는 사용자가 질문한 핵심 맥락과 키워드를 정확히 판단하고 핵심 키워드에 부합하지 않는 정보는 필터링하는 시스템 강화가 필요하다"며 "빙은 큐의 정보 도출 과정처럼 단계별 검색 결과 향상 프로세스를 도입하고 범용성과 심미성을 고려한 자체 서체를 개발해 UI 디자인에 적용할 것을 제안한다"고 밝혔다.
빙 코파일럿 검색 화면
[홈페이지 캡처. 재판매 및 DB 금지]