본문 바로가기

A.I.17

llama.cpp를 설치하여 Ubuntu 서버에서 llama-2 경량모델을 실행해보자 GPT-3.5나 GPT-4에 비하여 파라미터 수가 훨씬 적은 Llama-2 모델이지만, 여전히 로컬 환경이나 vRAM 크기가 작은 GPU로 실행하기에는 쉽지 않다. 다행히 가중치 양자화(quantization)를 비롯한 대규모 언어모델의 경량화 연구도 활발하게 이뤄지고 있고, 이에 따라 오픈소스 언어모델들의 양자화된 모델들이 GPTQ 또는 GGML 포맷으로 공개되고 있다. llama.cpp 레포는 Llama 모델의 추론 프로세스를 순수한 C/C++로 구현한 프로젝트로서, 맥북에서 4-bit quantized LLaMA 모델을 실행하는 것을 목표로 한다. 그러나 Windows나 Linux 등 다양한 플랫폼에서도 사용 가능하고, 점차 많은 모델들을 지원해 나가고 있으며, 여러 프로그래밍 언어로의 바인딩도 함.. 2023. 9. 26.
LLM)논문꼼꼼히읽기 - A Survey of Large Language Models 논문 주소 : A Survey of Large Language Models A Survey of Large Language Models Abstract 1950년에 튜링 테스트(Turing Test)가 제안된 이후, 기계가 인간의 언어기능을 이해하는 기술을 연구해 왔다. 참고) 기계의 지능이 인간의 지능과 비슷한지 또 구분할 수 있는 지를 판별하고자 하는 테스트 원래는 이미테이션 게임(Imitation game)으로 불렀고 기계 즉, 컴퓨터가 인간처럼 대화할 수 있다면, 인간처럼 사고할 수 있다는 생각이 깔려 있다. 지난 20여년간 인간의 언어를 이해하고 생성하는 연구의 주된 방향은 언어 모델링(Language Modeling)이었다. 통계적 언어모델(statistical language model)에서.. 2023. 9. 20.
논문리뷰) 어두운 영상의 밝기 조정 : Zero-Reference Deep Curve Estimation for Low-Light Image Enhancement 시선 예측을 위한 사용자 영상 뿐만 아니라 컴퓨터 비전의 다양한 태스크에 쓰이는 입력 영상들은 조명이나 카메라의 노출 변화에 따라 사람의 눈에 보이는 양상이 크게 변할 수 있다. 안정적이며 일관성있는 예측 성능을 얻기 위하여는 입력 영상의 밝기를 특정 범위로 제한하거나, 너무 어두운 이미지의 경우는 밝기를 조절할 필요가 있다. 어두운 조명이나 노출의 부족에 따라 광량이 부족한 이미지를 밝은 이미지로 변환하는 태스크를 light enhancement 라고 한다. 이번 포스트에서 리뷰하려는 Zero-DCE(Zero-Reference Deep Curve Estimation) 모델은 어두운 이미지를 밝게 하는 작업을 개별 이미지의 커브 예측 태스크로 생각한다. 신경망이 무겁지 않기 때문에 모바일과 같은 엣지 디.. 2022. 11. 3.
논문 리뷰)시선 예측 연구의 고전 - Eye Tracking for Everyone 2016년 CVPR에서 발표된 Eye Tracking for Everyone은 본격적으로 모바일 디바이스를 비롯한 상용장비에서 딥러닝 기반의 appearance-based eye tracking 연구가 시작되게 한 중요한 논문으로 꼽힌다. 이 논문의 발표와 함께 공개된 대규모 시선 예측을 위한 데이터셋 GazeCapture는 데이터의 다양성과 높은 신뢰도 덕분에 시선 추적 기술의 성능을 크게 향상시켰다. 이번 포스트에서는 이 논문의 리뷰를 통하여 초기 시선 예측 연구의 방향을 이해하고, 딥러닝 적용을 위한 데이터셋이 갖춰야 할 조건과 데이터셋을 활용한 시선 예측 모델에 대해 이해해보려고 한다. 논문 : Eye Tracking for Everyone GazeCapture 데이터셋 : https://gaze.. 2022. 8. 20.