2024.04.29 (월)

  • 맑음속초11.9℃
  • 맑음17.9℃
  • 맑음철원17.5℃
  • 맑음동두천20.2℃
  • 맑음파주19.5℃
  • 흐림대관령7.0℃
  • 맑음춘천17.8℃
  • 맑음백령도10.6℃
  • 맑음북강릉10.4℃
  • 구름조금강릉12.5℃
  • 흐림동해13.3℃
  • 맑음서울21.5℃
  • 맑음인천18.7℃
  • 흐림원주21.0℃
  • 비울릉도13.2℃
  • 맑음수원19.5℃
  • 흐림영월15.0℃
  • 흐림충주16.7℃
  • 맑음서산17.5℃
  • 흐림울진12.7℃
  • 흐림청주17.2℃
  • 흐림대전15.6℃
  • 흐림추풍령13.6℃
  • 흐림안동15.0℃
  • 흐림상주14.6℃
  • 구름많음포항14.5℃
  • 흐림군산17.6℃
  • 흐림대구14.8℃
  • 흐림전주16.8℃
  • 박무울산13.0℃
  • 흐림창원15.2℃
  • 흐림광주16.4℃
  • 흐림부산14.4℃
  • 흐림통영14.4℃
  • 비목포16.4℃
  • 비여수14.7℃
  • 안개흑산도13.9℃
  • 흐림완도15.8℃
  • 흐림고창15.4℃
  • 흐림순천15.0℃
  • 구름조금홍성(예)17.4℃
  • 흐림15.4℃
  • 비제주16.1℃
  • 흐림고산16.6℃
  • 구름많음성산16.3℃
  • 구름많음서귀포18.0℃
  • 흐림진주14.5℃
  • 맑음강화17.3℃
  • 구름많음양평20.5℃
  • 흐림이천19.3℃
  • 맑음인제13.5℃
  • 맑음홍천17.2℃
  • 흐림태백8.4℃
  • 구름많음정선군11.5℃
  • 흐림제천15.5℃
  • 흐림보은14.9℃
  • 흐림천안16.9℃
  • 맑음보령17.7℃
  • 흐림부여17.1℃
  • 흐림금산14.7℃
  • 흐림16.6℃
  • 흐림부안16.0℃
  • 흐림임실15.8℃
  • 흐림정읍16.0℃
  • 흐림남원15.6℃
  • 흐림장수14.2℃
  • 흐림고창군16.1℃
  • 흐림영광군15.0℃
  • 흐림김해시15.1℃
  • 흐림순창군16.0℃
  • 흐림북창원15.3℃
  • 구름많음양산시15.1℃
  • 흐림보성군15.6℃
  • 흐림강진군15.6℃
  • 흐림장흥15.6℃
  • 흐림해남16.0℃
  • 흐림고흥15.1℃
  • 흐림의령군15.1℃
  • 흐림함양군14.3℃
  • 흐림광양시15.0℃
  • 흐림진도군16.2℃
  • 흐림봉화13.9℃
  • 흐림영주15.5℃
  • 흐림문경14.7℃
  • 흐림청송군13.6℃
  • 흐림영덕13.6℃
  • 흐림의성14.8℃
  • 흐림구미15.3℃
  • 구름많음영천14.0℃
  • 흐림경주시13.9℃
  • 흐림거창13.4℃
  • 흐림합천14.6℃
  • 흐림밀양15.7℃
  • 흐림산청13.7℃
  • 흐림거제14.2℃
  • 흐림남해14.8℃
  • 구름많음15.7℃
기상청 제공
엔비디아, PC용 챗봇 전격 공개…인터넷 없어도 나만의 LLM 구동
  • 해당된 기사를 공유합니다

미디어

엔비디아, PC용 챗봇 전격 공개…인터넷 없어도 나만의 LLM 구동

- 클라우드 기반 LLM 필요 없어
- 나만의 데이터로 맞춤 챗봇”
- ‘챗 위드 RTX’ PC 버전 지원
- 지포스 RTX 30 이상서 사용

나만의데이터.png




(파이널24) 손호림 기자 = 엔비디아가 윈도 PC용 ‘챗 위드 RTX(Chat With RTX)’를 14일 공개했다. 엔비디아가 앞서 공개한 AI PC를 통해 ‘나만의 데이터’를 챗봇에 연결해 질의 응답할 수 있는 것이 특징이다.

 

엔비디아는 “사용자가 자신만의 콘텐츠로 챗봇을 개인화할 수 있다”면서 “엔비디아의 그래픽처리장치(GPU) 기반 클라우드 서버를 통해 매일 전 세계 수백만 명의 사용자들이 챗봇을 활용하고 있는데, 이제 엔비디아 RTX 기반의 윈도 PC에서도 사용이 가능해졌다”고 말했다.

 

클라우드 기반 AI를 넘어 온디바이스 AI로 무게축을 옮긴 대목이다.

 

‘챗 위드 RTX’는 로컬 엔비디아 지포스 RTX 30(GeForce RTX 30) 시리즈 GPU 이상을 필요로 한다. 또 최소 8GB 비디오 랜덤 액세스 메모리(VRAM)가 필요하다. 현재 미국 베스트바이에서는 엔비디아 지포스 RTX 3060 게이밍 데스크톱 가격이 약 899.99~1,299.99달러에 판매 중이다. 또 엔비디아 지포스 RTX 3080은 1499.99~2649.99달러 수준에 거래되고 있다.

 

‘챗 위드 RTX(Chat With RTX)’ 윈도 버전은 해당 PC에 무료로 내려 받아 사용할 수 있다. 특히 이 도구는 검색 증강생성(RAG), 엔비디아 텐서RT-LLM(TensorRT-LLM) 소프트웨어, RTX 가속화 등을 통해 디바이스에서도 생성형 AI 기능을 제공한다. 특히 검색 증강생성을 활용하면 ‘나만의 데이터’에서 필요한 정보를 질의 응답을 통해 찾아낼 수 있다. 엔비디아는 “PC 파일을 데이터세트로 활용해 빠르고 쉽게 대규모 언어 모델(LLM)에 연결하고 상황에 맞는 답변을 얻을 수 있다”고 말했다. 

 

또 PDF 등 다양한 파일도 연동해 데이터를 찾을 수 있다. 아울러 유튜브 동영상이나 재생 목록에 있는 정보까지 훑어준다. 개인화된 데이터를 바탕으로 상황에 맞는 질문에 답변할 수 있는 것이다. 엔비디아는 “PC에서 실행되므로 사용자의 데이터는 기기에 유지된다”며 “클라우드 기반 LLM 서비스를 사용하지 않아도 된다”고 강조했다.

 

‘챗 위드 RTX’는 윈도우 10, 11 및 최신 엔비디아 GPU 드라이버에서 사용할 수 있으며, 이는 RTX GPU로 LLM을 가속할 수 있는 잠재력을 보여준다는 것이 엔비디아측 설명이다. 개발자들은 깃허브(GitHub)에서 제공되는 텐서RT-LLM RAG 개발자 레퍼런스 프로젝트를 통해 직접 RTX용 RAG 기반 애플리케이션을 개발하고 배포할 수 있다.


엔비디아가 PC용 LLM 챗봇을 공개한 까닭은, 일반 클라우드 기업과 차별화를 위한 포석으로 보인다. 아마존 AWS, 마이크로소프트 애저, 구글 클라우드 등도 LLM 기반 챗봇을 공개하고 있지만 클라우드 기반이기 때문에 인터넷 연결 없이 사용이 불가능하며 과도한 인퍼런스 비용이 발생한다.






모바일 버전으로 보기