2024.04.29 (월)

  • 흐림속초11.8℃
  • 흐림14.5℃
  • 흐림철원12.6℃
  • 흐림동두천14.6℃
  • 흐림파주13.1℃
  • 흐림대관령6.9℃
  • 흐림춘천13.7℃
  • 구름조금백령도14.1℃
  • 흐림북강릉12.0℃
  • 흐림강릉12.8℃
  • 구름많음동해12.6℃
  • 흐림서울17.5℃
  • 흐림인천15.3℃
  • 흐림원주16.3℃
  • 박무울릉도14.2℃
  • 흐림수원16.4℃
  • 흐림영월15.4℃
  • 흐림충주18.2℃
  • 흐림서산15.1℃
  • 흐림울진12.9℃
  • 흐림청주20.2℃
  • 흐림대전18.3℃
  • 흐림추풍령14.8℃
  • 흐림안동14.4℃
  • 흐림상주15.5℃
  • 흐림포항14.5℃
  • 흐림군산16.2℃
  • 흐림대구14.4℃
  • 흐림전주18.1℃
  • 흐림울산14.0℃
  • 비창원16.3℃
  • 비광주15.1℃
  • 흐림부산15.6℃
  • 흐림통영14.5℃
  • 비목포14.8℃
  • 비여수15.3℃
  • 흐림흑산도14.2℃
  • 흐림완도15.6℃
  • 흐림고창18.4℃
  • 흐림순천13.2℃
  • 박무홍성(예)15.5℃
  • 흐림15.3℃
  • 비제주18.8℃
  • 흐림고산18.9℃
  • 흐림성산18.5℃
  • 천둥번개서귀포20.1℃
  • 흐림진주15.5℃
  • 흐림강화15.2℃
  • 흐림양평15.7℃
  • 흐림이천15.8℃
  • 흐림인제12.4℃
  • 흐림홍천14.3℃
  • 흐림태백8.1℃
  • 흐림정선군9.4℃
  • 흐림제천15.4℃
  • 흐림보은17.4℃
  • 흐림천안16.5℃
  • 흐림보령15.3℃
  • 흐림부여16.1℃
  • 흐림금산17.2℃
  • 흐림18.0℃
  • 흐림부안17.3℃
  • 흐림임실14.5℃
  • 흐림정읍16.0℃
  • 흐림남원15.9℃
  • 흐림장수14.5℃
  • 흐림고창군18.8℃
  • 흐림영광군18.3℃
  • 흐림김해시15.5℃
  • 흐림순창군15.6℃
  • 흐림북창원17.2℃
  • 흐림양산시15.8℃
  • 흐림보성군14.6℃
  • 흐림강진군15.1℃
  • 흐림장흥15.0℃
  • 흐림해남15.7℃
  • 흐림고흥15.5℃
  • 흐림의령군16.1℃
  • 흐림함양군15.7℃
  • 흐림광양시15.4℃
  • 흐림진도군16.5℃
  • 흐림봉화11.7℃
  • 흐림영주13.5℃
  • 흐림문경14.5℃
  • 흐림청송군12.3℃
  • 흐림영덕13.4℃
  • 흐림의성13.4℃
  • 흐림구미15.5℃
  • 흐림영천13.5℃
  • 흐림경주시14.2℃
  • 흐림거창15.5℃
  • 흐림합천16.0℃
  • 흐림밀양15.8℃
  • 흐림산청15.4℃
  • 흐림거제14.9℃
  • 흐림남해15.2℃
  • 흐림16.0℃
기상청 제공
엔비디아, PC용 챗봇 전격 공개…인터넷 없어도 나만의 LLM 구동
  • 해당된 기사를 공유합니다

미디어

엔비디아, PC용 챗봇 전격 공개…인터넷 없어도 나만의 LLM 구동

- 클라우드 기반 LLM 필요 없어
- 나만의 데이터로 맞춤 챗봇”
- ‘챗 위드 RTX’ PC 버전 지원
- 지포스 RTX 30 이상서 사용

나만의데이터.png




(파이널24) 손호림 기자 = 엔비디아가 윈도 PC용 ‘챗 위드 RTX(Chat With RTX)’를 14일 공개했다. 엔비디아가 앞서 공개한 AI PC를 통해 ‘나만의 데이터’를 챗봇에 연결해 질의 응답할 수 있는 것이 특징이다.

 

엔비디아는 “사용자가 자신만의 콘텐츠로 챗봇을 개인화할 수 있다”면서 “엔비디아의 그래픽처리장치(GPU) 기반 클라우드 서버를 통해 매일 전 세계 수백만 명의 사용자들이 챗봇을 활용하고 있는데, 이제 엔비디아 RTX 기반의 윈도 PC에서도 사용이 가능해졌다”고 말했다.

 

클라우드 기반 AI를 넘어 온디바이스 AI로 무게축을 옮긴 대목이다.

 

‘챗 위드 RTX’는 로컬 엔비디아 지포스 RTX 30(GeForce RTX 30) 시리즈 GPU 이상을 필요로 한다. 또 최소 8GB 비디오 랜덤 액세스 메모리(VRAM)가 필요하다. 현재 미국 베스트바이에서는 엔비디아 지포스 RTX 3060 게이밍 데스크톱 가격이 약 899.99~1,299.99달러에 판매 중이다. 또 엔비디아 지포스 RTX 3080은 1499.99~2649.99달러 수준에 거래되고 있다.

 

‘챗 위드 RTX(Chat With RTX)’ 윈도 버전은 해당 PC에 무료로 내려 받아 사용할 수 있다. 특히 이 도구는 검색 증강생성(RAG), 엔비디아 텐서RT-LLM(TensorRT-LLM) 소프트웨어, RTX 가속화 등을 통해 디바이스에서도 생성형 AI 기능을 제공한다. 특히 검색 증강생성을 활용하면 ‘나만의 데이터’에서 필요한 정보를 질의 응답을 통해 찾아낼 수 있다. 엔비디아는 “PC 파일을 데이터세트로 활용해 빠르고 쉽게 대규모 언어 모델(LLM)에 연결하고 상황에 맞는 답변을 얻을 수 있다”고 말했다. 

 

또 PDF 등 다양한 파일도 연동해 데이터를 찾을 수 있다. 아울러 유튜브 동영상이나 재생 목록에 있는 정보까지 훑어준다. 개인화된 데이터를 바탕으로 상황에 맞는 질문에 답변할 수 있는 것이다. 엔비디아는 “PC에서 실행되므로 사용자의 데이터는 기기에 유지된다”며 “클라우드 기반 LLM 서비스를 사용하지 않아도 된다”고 강조했다.

 

‘챗 위드 RTX’는 윈도우 10, 11 및 최신 엔비디아 GPU 드라이버에서 사용할 수 있으며, 이는 RTX GPU로 LLM을 가속할 수 있는 잠재력을 보여준다는 것이 엔비디아측 설명이다. 개발자들은 깃허브(GitHub)에서 제공되는 텐서RT-LLM RAG 개발자 레퍼런스 프로젝트를 통해 직접 RTX용 RAG 기반 애플리케이션을 개발하고 배포할 수 있다.


엔비디아가 PC용 LLM 챗봇을 공개한 까닭은, 일반 클라우드 기업과 차별화를 위한 포석으로 보인다. 아마존 AWS, 마이크로소프트 애저, 구글 클라우드 등도 LLM 기반 챗봇을 공개하고 있지만 클라우드 기반이기 때문에 인터넷 연결 없이 사용이 불가능하며 과도한 인퍼런스 비용이 발생한다.






모바일 버전으로 보기