2024.04.29 (월)

  • 흐림속초12.2℃
  • 흐림14.6℃
  • 흐림철원12.7℃
  • 흐림동두천14.3℃
  • 흐림파주13.0℃
  • 흐림대관령7.3℃
  • 흐림춘천13.5℃
  • 구름많음백령도13.7℃
  • 흐림북강릉12.3℃
  • 흐림강릉12.4℃
  • 흐림동해13.2℃
  • 흐림서울17.2℃
  • 흐림인천16.6℃
  • 흐림원주16.4℃
  • 흐림울릉도14.7℃
  • 흐림수원17.6℃
  • 흐림영월15.8℃
  • 흐림충주17.5℃
  • 흐림서산16.5℃
  • 흐림울진13.7℃
  • 흐림청주19.5℃
  • 흐림대전17.8℃
  • 흐림추풍령12.1℃
  • 흐림안동13.8℃
  • 흐림상주14.1℃
  • 흐림포항14.5℃
  • 흐림군산17.4℃
  • 비대구13.4℃
  • 비전주18.2℃
  • 흐림울산14.1℃
  • 비창원14.6℃
  • 비광주15.0℃
  • 비부산14.4℃
  • 흐림통영14.0℃
  • 흐림목포15.7℃
  • 비여수14.8℃
  • 흐림흑산도13.9℃
  • 흐림완도16.0℃
  • 흐림고창16.4℃
  • 흐림순천13.7℃
  • 흐림홍성(예)16.7℃
  • 흐림17.1℃
  • 비제주18.9℃
  • 흐림고산18.0℃
  • 흐림성산19.1℃
  • 비서귀포19.4℃
  • 흐림진주14.6℃
  • 흐림강화14.8℃
  • 흐림양평15.7℃
  • 흐림이천15.5℃
  • 흐림인제12.5℃
  • 흐림홍천14.4℃
  • 흐림태백8.4℃
  • 흐림정선군11.8℃
  • 흐림제천15.4℃
  • 흐림보은15.8℃
  • 흐림천안17.8℃
  • 흐림보령17.7℃
  • 흐림부여17.3℃
  • 흐림금산15.7℃
  • 흐림18.2℃
  • 흐림부안16.6℃
  • 흐림임실14.9℃
  • 흐림정읍16.8℃
  • 흐림남원16.0℃
  • 흐림장수14.1℃
  • 흐림고창군16.2℃
  • 흐림영광군15.6℃
  • 흐림김해시14.6℃
  • 흐림순창군15.5℃
  • 흐림북창원14.9℃
  • 흐림양산시15.1℃
  • 흐림보성군15.7℃
  • 흐림강진군16.1℃
  • 흐림장흥15.9℃
  • 흐림해남17.1℃
  • 흐림고흥15.7℃
  • 흐림의령군14.5℃
  • 흐림함양군15.0℃
  • 흐림광양시14.8℃
  • 흐림진도군16.1℃
  • 흐림봉화12.9℃
  • 흐림영주13.6℃
  • 흐림문경14.2℃
  • 흐림청송군12.1℃
  • 흐림영덕13.7℃
  • 흐림의성12.9℃
  • 흐림구미13.4℃
  • 흐림영천13.4℃
  • 흐림경주시14.0℃
  • 흐림거창13.5℃
  • 흐림합천13.9℃
  • 흐림밀양15.6℃
  • 흐림산청14.7℃
  • 흐림거제14.6℃
  • 흐림남해14.5℃
  • 흐림15.5℃
기상청 제공
엔비디아, PC용 챗봇 전격 공개…인터넷 없어도 나만의 LLM 구동
  • 해당된 기사를 공유합니다

미디어

엔비디아, PC용 챗봇 전격 공개…인터넷 없어도 나만의 LLM 구동

- 클라우드 기반 LLM 필요 없어
- 나만의 데이터로 맞춤 챗봇”
- ‘챗 위드 RTX’ PC 버전 지원
- 지포스 RTX 30 이상서 사용

나만의데이터.png




(파이널24) 손호림 기자 = 엔비디아가 윈도 PC용 ‘챗 위드 RTX(Chat With RTX)’를 14일 공개했다. 엔비디아가 앞서 공개한 AI PC를 통해 ‘나만의 데이터’를 챗봇에 연결해 질의 응답할 수 있는 것이 특징이다.

 

엔비디아는 “사용자가 자신만의 콘텐츠로 챗봇을 개인화할 수 있다”면서 “엔비디아의 그래픽처리장치(GPU) 기반 클라우드 서버를 통해 매일 전 세계 수백만 명의 사용자들이 챗봇을 활용하고 있는데, 이제 엔비디아 RTX 기반의 윈도 PC에서도 사용이 가능해졌다”고 말했다.

 

클라우드 기반 AI를 넘어 온디바이스 AI로 무게축을 옮긴 대목이다.

 

‘챗 위드 RTX’는 로컬 엔비디아 지포스 RTX 30(GeForce RTX 30) 시리즈 GPU 이상을 필요로 한다. 또 최소 8GB 비디오 랜덤 액세스 메모리(VRAM)가 필요하다. 현재 미국 베스트바이에서는 엔비디아 지포스 RTX 3060 게이밍 데스크톱 가격이 약 899.99~1,299.99달러에 판매 중이다. 또 엔비디아 지포스 RTX 3080은 1499.99~2649.99달러 수준에 거래되고 있다.

 

‘챗 위드 RTX(Chat With RTX)’ 윈도 버전은 해당 PC에 무료로 내려 받아 사용할 수 있다. 특히 이 도구는 검색 증강생성(RAG), 엔비디아 텐서RT-LLM(TensorRT-LLM) 소프트웨어, RTX 가속화 등을 통해 디바이스에서도 생성형 AI 기능을 제공한다. 특히 검색 증강생성을 활용하면 ‘나만의 데이터’에서 필요한 정보를 질의 응답을 통해 찾아낼 수 있다. 엔비디아는 “PC 파일을 데이터세트로 활용해 빠르고 쉽게 대규모 언어 모델(LLM)에 연결하고 상황에 맞는 답변을 얻을 수 있다”고 말했다. 

 

또 PDF 등 다양한 파일도 연동해 데이터를 찾을 수 있다. 아울러 유튜브 동영상이나 재생 목록에 있는 정보까지 훑어준다. 개인화된 데이터를 바탕으로 상황에 맞는 질문에 답변할 수 있는 것이다. 엔비디아는 “PC에서 실행되므로 사용자의 데이터는 기기에 유지된다”며 “클라우드 기반 LLM 서비스를 사용하지 않아도 된다”고 강조했다.

 

‘챗 위드 RTX’는 윈도우 10, 11 및 최신 엔비디아 GPU 드라이버에서 사용할 수 있으며, 이는 RTX GPU로 LLM을 가속할 수 있는 잠재력을 보여준다는 것이 엔비디아측 설명이다. 개발자들은 깃허브(GitHub)에서 제공되는 텐서RT-LLM RAG 개발자 레퍼런스 프로젝트를 통해 직접 RTX용 RAG 기반 애플리케이션을 개발하고 배포할 수 있다.


엔비디아가 PC용 LLM 챗봇을 공개한 까닭은, 일반 클라우드 기업과 차별화를 위한 포석으로 보인다. 아마존 AWS, 마이크로소프트 애저, 구글 클라우드 등도 LLM 기반 챗봇을 공개하고 있지만 클라우드 기반이기 때문에 인터넷 연결 없이 사용이 불가능하며 과도한 인퍼런스 비용이 발생한다.






모바일 버전으로 보기