2024.05.15 (수)

  • 흐림속초15.8℃
  • 구름많음20.8℃
  • 흐림철원13.8℃
  • 흐림동두천13.1℃
  • 흐림파주12.6℃
  • 흐림대관령14.0℃
  • 구름많음춘천22.1℃
  • 흐림백령도11.3℃
  • 흐림북강릉18.2℃
  • 구름많음강릉19.5℃
  • 구름조금동해22.8℃
  • 흐림서울16.1℃
  • 흐림인천14.6℃
  • 구름많음원주20.6℃
  • 맑음울릉도20.6℃
  • 흐림수원17.2℃
  • 구름조금영월21.3℃
  • 맑음충주21.1℃
  • 흐림서산14.4℃
  • 맑음울진22.5℃
  • 맑음청주22.4℃
  • 맑음대전22.1℃
  • 맑음추풍령21.2℃
  • 맑음안동23.2℃
  • 맑음상주22.7℃
  • 맑음포항26.2℃
  • 구름조금군산19.0℃
  • 맑음대구25.0℃
  • 맑음전주21.3℃
  • 맑음울산23.6℃
  • 맑음창원25.1℃
  • 맑음광주22.9℃
  • 맑음부산23.1℃
  • 맑음통영22.3℃
  • 맑음목포19.7℃
  • 맑음여수22.1℃
  • 흐림흑산도15.0℃
  • 맑음완도22.1℃
  • 맑음고창21.3℃
  • 맑음순천21.3℃
  • 흐림홍성(예)18.0℃
  • 맑음20.9℃
  • 맑음제주22.8℃
  • 맑음고산21.2℃
  • 맑음성산21.9℃
  • 맑음서귀포22.6℃
  • 맑음진주24.2℃
  • 흐림강화13.6℃
  • 구름많음양평20.3℃
  • 구름조금이천22.1℃
  • 흐림인제19.5℃
  • 구름조금홍천22.0℃
  • 구름많음태백21.2℃
  • 구름많음정선군23.1℃
  • 구름조금제천21.1℃
  • 맑음보은21.2℃
  • 맑음천안21.7℃
  • 흐림보령18.1℃
  • 맑음부여22.1℃
  • 맑음금산21.3℃
  • 맑음21.6℃
  • 맑음부안20.7℃
  • 맑음임실21.7℃
  • 맑음정읍22.7℃
  • 맑음남원22.9℃
  • 맑음장수20.6℃
  • 맑음고창군22.2℃
  • 구름조금영광군19.9℃
  • 맑음김해시23.7℃
  • 맑음순창군21.9℃
  • 맑음북창원26.9℃
  • 맑음양산시25.2℃
  • 맑음보성군23.4℃
  • 맑음강진군23.0℃
  • 맑음장흥22.7℃
  • 맑음해남22.1℃
  • 맑음고흥22.2℃
  • 맑음의령군25.9℃
  • 맑음함양군23.5℃
  • 맑음광양시24.1℃
  • 맑음진도군19.4℃
  • 맑음봉화22.4℃
  • 맑음영주22.4℃
  • 맑음문경22.6℃
  • 맑음청송군24.1℃
  • 맑음영덕23.2℃
  • 맑음의성24.5℃
  • 맑음구미25.2℃
  • 맑음영천24.8℃
  • 맑음경주시26.8℃
  • 맑음거창24.0℃
  • 맑음합천26.1℃
  • 맑음밀양25.9℃
  • 맑음산청24.8℃
  • 맑음거제22.6℃
  • 맑음남해23.6℃
  • 맑음23.9℃
기상청 제공
엔비디아, PC용 챗봇 전격 공개…인터넷 없어도 나만의 LLM 구동
  • 해당된 기사를 공유합니다

미디어

엔비디아, PC용 챗봇 전격 공개…인터넷 없어도 나만의 LLM 구동

- 클라우드 기반 LLM 필요 없어
- 나만의 데이터로 맞춤 챗봇”
- ‘챗 위드 RTX’ PC 버전 지원
- 지포스 RTX 30 이상서 사용

나만의데이터.png




(파이널24) 손호림 기자 = 엔비디아가 윈도 PC용 ‘챗 위드 RTX(Chat With RTX)’를 14일 공개했다. 엔비디아가 앞서 공개한 AI PC를 통해 ‘나만의 데이터’를 챗봇에 연결해 질의 응답할 수 있는 것이 특징이다.

 

엔비디아는 “사용자가 자신만의 콘텐츠로 챗봇을 개인화할 수 있다”면서 “엔비디아의 그래픽처리장치(GPU) 기반 클라우드 서버를 통해 매일 전 세계 수백만 명의 사용자들이 챗봇을 활용하고 있는데, 이제 엔비디아 RTX 기반의 윈도 PC에서도 사용이 가능해졌다”고 말했다.

 

클라우드 기반 AI를 넘어 온디바이스 AI로 무게축을 옮긴 대목이다.

 

‘챗 위드 RTX’는 로컬 엔비디아 지포스 RTX 30(GeForce RTX 30) 시리즈 GPU 이상을 필요로 한다. 또 최소 8GB 비디오 랜덤 액세스 메모리(VRAM)가 필요하다. 현재 미국 베스트바이에서는 엔비디아 지포스 RTX 3060 게이밍 데스크톱 가격이 약 899.99~1,299.99달러에 판매 중이다. 또 엔비디아 지포스 RTX 3080은 1499.99~2649.99달러 수준에 거래되고 있다.

 

‘챗 위드 RTX(Chat With RTX)’ 윈도 버전은 해당 PC에 무료로 내려 받아 사용할 수 있다. 특히 이 도구는 검색 증강생성(RAG), 엔비디아 텐서RT-LLM(TensorRT-LLM) 소프트웨어, RTX 가속화 등을 통해 디바이스에서도 생성형 AI 기능을 제공한다. 특히 검색 증강생성을 활용하면 ‘나만의 데이터’에서 필요한 정보를 질의 응답을 통해 찾아낼 수 있다. 엔비디아는 “PC 파일을 데이터세트로 활용해 빠르고 쉽게 대규모 언어 모델(LLM)에 연결하고 상황에 맞는 답변을 얻을 수 있다”고 말했다. 

 

또 PDF 등 다양한 파일도 연동해 데이터를 찾을 수 있다. 아울러 유튜브 동영상이나 재생 목록에 있는 정보까지 훑어준다. 개인화된 데이터를 바탕으로 상황에 맞는 질문에 답변할 수 있는 것이다. 엔비디아는 “PC에서 실행되므로 사용자의 데이터는 기기에 유지된다”며 “클라우드 기반 LLM 서비스를 사용하지 않아도 된다”고 강조했다.

 

‘챗 위드 RTX’는 윈도우 10, 11 및 최신 엔비디아 GPU 드라이버에서 사용할 수 있으며, 이는 RTX GPU로 LLM을 가속할 수 있는 잠재력을 보여준다는 것이 엔비디아측 설명이다. 개발자들은 깃허브(GitHub)에서 제공되는 텐서RT-LLM RAG 개발자 레퍼런스 프로젝트를 통해 직접 RTX용 RAG 기반 애플리케이션을 개발하고 배포할 수 있다.


엔비디아가 PC용 LLM 챗봇을 공개한 까닭은, 일반 클라우드 기업과 차별화를 위한 포석으로 보인다. 아마존 AWS, 마이크로소프트 애저, 구글 클라우드 등도 LLM 기반 챗봇을 공개하고 있지만 클라우드 기반이기 때문에 인터넷 연결 없이 사용이 불가능하며 과도한 인퍼런스 비용이 발생한다.






모바일 버전으로 보기