New Score :0
High Score :0
Run Best
NICE BUSINESS TYPE INDICATOR
3. ๊ธ์ ์ ์น๊ตฌ์๊ฒ ๋น๋ ธ๋๋ฐ ์ค๋์ด ๋์ ์ฃผ๊ธฐ๋ก ํ๋ .. ๊ทธ๋ฐ๋ฐ ์นด๋๊ฐ์ ๋ด์ผํ๋ ๋ ๋ ์ค๋์ธ๋ฐ... ์ด๊ฑธ ์ด์ฉ๋...
4. ์ฐ๋ฆฌ ํ์ฌ๋ ์ค์ํ ์์ฌ ๊ฒฐ์ ์ ํ ๋?
5. ์ด์ฌํ ์ผํ ๋๋ฅผ ์ํ ์ ๋ฌผ์ ์ฃผ๊ณ ์ถ๋ค. ์ด๋ค๊ฒ ์ข์๊น?
6. ์ํ์์ ํฌ์์ํ์ ์ถ์ฒ๋ฐ์๋ค. ์ด๋ค๊ฑธ ๊ฐ์ ํ์ง?
7. ํ์ฌ์์์ ๋๋?
8. ๊ฟ์์ ๊นจ์ด๋๋ 20๋ ์ ์ผ๋ก ๋์๊ฐ๋ค. ๋น์ ์ด ์ ์ผ ๋จผ์ ํ๋์ผ์?
9. ๋ด๊ฐ ์ธ์ฌ ๋ด๋น์๋ผ๋ฉด ์ ๊ท ์ ์ฌ์ ์ฑ์ฉ ์ ์ ์ผ ์ค์ํ๊ฒ ๋ณด๋๊ฒ์?
10. ํ์ฌ์ ์ ๋ง ์ซ์ดํ๋ ๋๋ฃ๊ฐ ์๋ค๋ฉด?
11. ๊ฐ๋ํ ์ง์ ๊ฐ์ฅ์ด ๋์๋ค.. ์๋ ์ ์์ผ ๋ ์ ๋ฌผ์?
12. ํ์ ํ์ฌ ์ถ๊ทผ ์คํ์ผ์?
13.ํ์ฌ ์ฒด์ก๋ํ ํ๋ ๋ ์ด๋ค. ์ค๋ ๋ญํ์ง?
14. ๋์ ์ ๋ฌด ์คํ์ผ์?
๋น์ฟ ๋: UC ๋ฒํด๋ฆฌ, CMU, ์คํ ํฌ๋ ๋ฐ UC ์๋์์ด๊ณ ์ถ์ ์ ํ์์ผ๋ก ๊ตฌ์ฑ๋ ํ
GPT-4๋ฅผ ์ฌ์ฉํ ์ฌ๋ฏธ ์๊ณ ๋น ๊ณผํ์ ์ธ ํ๊ฐ์ ๋ฐ๋ฅด๋ฉด. ๋ ์๊ฒฉํ ํ๊ฐ๊ฐ ํ์ํฉ๋๋ค.
ShareGPT์์ ์์งํ ์ฌ์ฉ์ ๊ณต์ ๋ํ์์ LLaMA๋ฅผ ๋ฏธ์ธ ์กฐ์ ํ์ฌ ํ๋ จ๋ ์คํ ์์ค ์ฑ๋ด์ธ Vicuna-13B๋ฅผ ์๊ฐํฉ๋๋ค. GPT-4๋ฅผ ์ฌ์ฌ์์์ผ๋ก ์ฌ์ฉํ ์๋น ํ๊ฐ์ ๋ฐ๋ฅด๋ฉด Vicuna-13B๋ OpenAI ChatGPT ๋ฐ Google Bard์ 90%* ์ด์์ ํ์ง์ ๋ฌ์ฑํ๋ ๋ฐ๋ฉด LLaMA ๋ฐ Stanford Alfaca์ ๊ฐ์ ๋ค๋ฅธ ๋ชจ๋ธ์ 90%* ์ด์์ ์ฌ๋ก์์ ๋ฅ๊ฐํ๋ ๊ฒ์ผ๋ก ๋ํ๋ฌ์ต๋๋ค. Vicuna-13B ํ๋ จ ๋น์ฉ์ ์ฝ $ 300์ ๋๋ค. ๊ต์ก ๋ฐ ์ ๊ณต ์ฝ๋๋ ์จ๋ผ์ธ ๋ฐ๋ชจ์ ํจ๊ป ๋น์์ ์ ์ฉ๋๋ก ๊ณต๊ฐ์ ์ผ๋ก ์ฌ์ฉํ ์ ์์ต๋๋ค.

Vicuna (generated by stable diffusion 2.1)
๋น์ฟ ๋๋ ์ผ๋ง๋ ์ข์๊ฐ์?
์ฐ๋ฆฌ๋ ๋ฒค์น ๋งํฌ ์ง๋ฌธ์ ๋ํ Alpaca ๋ฐ Vicuna ์๋ต์ ์๋ฅผ ์ ์ํฉ๋๋ค. 70K ์ฌ์ฉ์ ๊ณต์ ChatGPT ๋ํ๋ก Vicuna๋ฅผ ๋ฏธ์ธ ์กฐ์ ํ ํ Vicuna๊ฐ ChatGPT์ ๋๋ฑํ ํ์ง๋ก ์ํ์นด (์๋ ์ ์ฐธ์กฐ)์ ๋นํด ๋ ์์ธํ๊ณ ๊ตฌ์กฐํ ๋ ๋ต๋ณ์ ์์ฑ ํ ์ ์์์ ๋ฐ๊ฒฌํ์ต๋๋ค.
๊ทธ๋ฌ๋ ์ฑ๋ด์ ํ๊ฐํ๋ ๊ฒ์ ๊ฒฐ์ฝ ๊ฐ๋จํ ์์ ์ด ์๋๋๋ค. ์ต๊ทผ GPT-4์ ๋ฐ์ ์ผ๋ก ์ธํด ๊ทธ ๊ธฐ๋ฅ์ด ๋ฒค์น๋งํฌ ์์ฑ ๋ฐ ์ฑ๋ฅ ํ๊ฐ๋ฅผ ์ํ ์๋ํ๋ ํ๊ฐ ํ๋ ์์ํฌ๋ฅผ ๊ฐ๋ฅํ๊ฒ ํ ์ ์๋ ์ธ๊ฐ๊ณผ ์ ์ฌํ ์์ค์ ๋๋ฌํ๋์ง ๊ถ๊ธํฉ๋๋ค. ์ด๊ธฐ ์กฐ์ฌ ๊ฒฐ๊ณผ์ ๋ฐ๋ฅด๋ฉด GPT-4๋ ์ฑ๋ด์ ๋ต๋ณ์ ๋น๊ตํ ๋ ๋งค์ฐ ์ผ๊ด๋ ์์์ ์์ธํ ํ๊ฐ๋ฅผ ์์ฑํ ์ ์์ต๋๋ค(์์ GPT-4 ํ๋จ ์ ์ฐธ์กฐ). ๊ทธ๋ฆผ 4์ ์์ฝ๋ GPT-1๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ ์๋น ํ๊ฐ์ ๋ฐ๋ฅด๋ฉด Vicuna๋ Bard/ChatGPT์ 90%* ๊ธฐ๋ฅ์ ๋ฌ์ฑํ์ต๋๋ค. ์ด ์ ์๋ ํ๋ ์์ํฌ๋ ์ฑ๋ด ํ๊ฐ๋ฅผ ์๋ํํ ์ ์๋ ์ ์ฌ๋ ฅ์ ๋ณด์ฌ์ฃผ์ง๋ง ์์ง ์๊ฒฉํ ์ ๊ทผ ๋ฐฉ์์ ์๋๋๋ค. ์ฑ๋ด์ ๋ํ ํ๊ฐ ์์คํ ์ ๊ตฌ์ถํ๋ ๊ฒ์ ์ถ๊ฐ ์ฐ๊ตฌ๊ฐ ํ์ํ ๋ฏธํด๊ฒฐ ์ง๋ฌธ์ผ๋ก ๋จ์ ์์ต๋๋ค. ์์ธํ ๋ด์ฉ์ ํ๊ฐ ์น์ ์ ๋์ ์์ต๋๋ค.

Online Demo
Try the Vicuna-13B demo here!
๊ฐ์
๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(LLM)์ ๊ธ์ํ ๋ฐ์ ์ ์ฑ๋ด ์์คํ ์ ํ๋ช ์ ์ผ์ผ์ผ OpenAI์ ChatGPT์์ ๋ณผ ์ ์๋ฏ์ด ์ ๋ก ์๋ ์์ค์ ์ธํ ๋ฆฌ์ ์ค๋ฅผ ์ ๊ณตํ์ต๋๋ค. ๊ทธ๋ฌ๋ ์ธ์์ ์ธ ์ฑ๋ฅ์๋ ๋ถ๊ตฌํ๊ณ ChatGPT์ ๊ต์ก ๋ฐ ์ํคํ ์ฒ ์ธ๋ถ ์ฌํญ์ ๋ถ๋ถ๋ช ํ์ฌ ์ด ๋ถ์ผ์ ์ฐ๊ตฌ ๋ฐ ์คํ ์์ค ํ์ ์ ๋ฐฉํดํฉ๋๋ค. Meta LLaMA ๋ฐ ์คํ ํฌ๋ ์ํ์นด ํ๋ก์ ํธ์์ ์๊ฐ์ ๋ฐ์ ํฅ์๋ ๋ฐ์ดํฐ ์ธํธ์ ์ฌ์ฉํ๊ธฐ ์ฝ๊ณ ํ์ฅ ๊ฐ๋ฅํ ์ธํ๋ผ๋ก ๋ท๋ฐ์นจ๋๋ ์คํ ์์ค ์ฑ๋ด์ธ Vicuna-13B๋ฅผ ์๊ฐํฉ๋๋ค. Vicuna-13B๋ ShareGPT.com ์์ ์์งํ ์ฌ์ฉ์ ๊ณต์ ๋ํ์์ LLaMA ๊ธฐ๋ณธ ๋ชจ๋ธ์ ๋ฏธ์ธ ์กฐ์ ํ์ฌ ์คํ ํฌ๋ ์ํ์นด์ ๊ฐ์ ๋ค๋ฅธ ์คํ ์์ค ๋ชจ๋ธ์ ๋นํด ๊ฒฝ์๋ ฅ ์๋ ์ฑ๋ฅ์ ์ ์ฆํ์ต๋๋ค. ์ด ๋ธ๋ก๊ทธ ๊ฒ์๋ฌผ์ Vicuna-13B์ ์ฑ๋ฅ์ ๋ํ ์๋น ํ๊ฐ๋ฅผ ์ ๊ณตํ๊ณ ๊ต์ก ๋ฐ ์๋น์ค ์ธํ๋ผ์ ๋ํด ์ค๋ช ํฉ๋๋ค. ๋ํ ์ปค๋ฎค๋ํฐ๊ฐ ์จ๋ผ์ธ ๋ฐ๋ชจ์ ์ํธ ์์ฉํ์ฌ ์ด ์ฑ๋ด์ ๊ธฐ๋ฅ์ ํ ์คํธํ๋๋ก ์ด๋ํฉ๋๋ค.

๊ทธ๋ฆผ 2๋ ์์ ์ ๋ํ ๊ฐ์๋ฅผ ์ ๊ณตํฉ๋๋ค. ์์ํ๊ธฐ ์ํด ์ฌ์ฉ์๊ฐ ChatGPT ๋ํ๋ฅผ ๊ณต์ ํ ์์๋ ์น ์ฌ์ดํธ ์ธ ShareGPT.com ์์ ์ฝ 70K ๋ํ๋ฅผ ์์งํ์ต๋๋ค. ๋ค์์ผ๋ก, Alpaca์์ ์ ๊ณตํ๋ ๊ต์ก ์คํฌ๋ฆฝํธ๋ฅผ ๊ฐ์ ํ์ฌ ๋ค์ค ๋ผ์ด๋ ๋ํ์ ๊ธด ์ํ์ค๋ฅผ ๋ ์ ์ฒ๋ฆฌํ์ต๋๋ค. ํ๋ จ์ ํ์ดํ ์น FSDP๋ก ํ๋ฃจ ๋ง์ 8๊ฐ์ A100 GPU์์ ์ํ๋์์ต๋๋ค. ๋ฐ๋ชจ๋ฅผ ์ ๊ณตํ๊ธฐ ์ํด ๊ฒฝ๋ ๋ถ์ฐ ์ ๊ณต ์์คํ ์ ๊ตฌํํ์ต๋๋ค. 80๊ฐ์ ๋ค์ํ ์ง๋ฌธ ์ธํธ๋ฅผ ๋ง๋ค๊ณ GPT-4๋ฅผ ํ์ฉํ์ฌ ๋ชจ๋ธ ์ถ๋ ฅ์ ํ๋จํ์ฌ ๋ชจ๋ธ ํ์ง์ ๋ํ ์๋น ํ๊ฐ๋ฅผ ์ํํ์ต๋๋ค. ๋ ๊ฐ์ ์๋ก ๋ค๋ฅธ ๋ชจ๋ธ์ ๋น๊ตํ๊ธฐ ์ํด ๊ฐ ๋ชจ๋ธ์ ์ถ๋ ฅ์ ๊ฐ ์ง๋ฌธ์ ๋ํ ๋จ์ผ ํ๋กฌํํธ๋ก ๊ฒฐํฉํฉ๋๋ค. ๊ทธ๋ฐ ๋ค์ ํ๋กฌํํธ๊ฐ GPT-4๋ก ์ ์ก๋์ด ์ด๋ค ๋ชจ๋ธ์ด ๋ ๋์ ์๋ต์ ์ ๊ณตํ๋์ง ํ๊ฐํฉ๋๋ค. LLaMA, ์ํ์นด, ChatGPT ๋ฐ Vicuna์ ์์ธํ ๋น๊ต๋ ์๋ ํ 1์ ๋์ ์์ต๋๋ค.
Table 1. Comparison between several notable models
Model Name | LLaMA | Alpaca | Vicuna | Bard/ChatGPT |
Dataset | Publicly available datasets (1T token) |
Self-instruct from davinci-003 API (52K samples) |
User-shared conversations (70K samples) |
N/A |
Training code | N/A | Available | Available | N/A |
Evaluation metrics | Academic benchmark | Author evaluation | GPT-4 assessment | Mixed |
Training cost (7B) |
82K GPU-hours | $500 (data) + $100 (training) | $140 (training) | N/A |
Training cost (13B) |
135K GPU-hours | N/A | $300 (training) | N/A |
Training
Vicuna๋ ๊ณต๊ฐ API๋ฅผ ์ฌ์ฉํ์ฌ ShareGPT.com ์์ ์์งํ ์ฝ 70K๊ฐ์ ์ฌ์ฉ์ ๊ณต์ ๋ํ๋ฅผ ์ฌ์ฉํ์ฌ LLaMA ๊ธฐ๋ณธ ๋ชจ๋ธ์ ๋ฏธ์ธ ์กฐ์ ํ์ฌ ๋ง๋ค์ด์ง๋๋ค. ๋ฐ์ดํฐ ํ์ง์ ๋ณด์ฅํ๊ธฐ ์ํด HTML์ ๋ค์ ๋งํฌ๋ค์ด์ผ๋ก ๋ณํํ๊ณ ์ผ๋ถ ๋ถ์ ์ ํ๊ฑฐ๋ ํ์ง์ด ๋ฎ์ ์ํ์ ํํฐ๋งํฉ๋๋ค. ๋ํ ๊ธด ๋ํ๋ฅผ ๋ชจ๋ธ์ ์ต๋ ์ปจํ ์คํธ ๊ธธ์ด์ ๋ง๋ ๋ ์์ ์ธ๊ทธ๋จผํธ๋ก ๋๋๋๋ค.
์ฐ๋ฆฌ์ ํ๋ จ ๋ ์ํผ๋ ๋ค์๊ณผ ๊ฐ์ ๊ฐ์ ์ฌํญ์ ํตํด ์คํ ํฌ๋์ ์ํ์นด ์์ ๊ตฌ์ถ๋ฉ๋๋ค.
- ๋ฉ๋ชจ๋ฆฌ ์ต์ ํ: Vicuna๊ฐ ๊ธด ์ปจํ ์คํธ๋ฅผ ์ดํดํ ์ ์๋๋ก alpaca์ ์ต๋ ์ปจํ ์คํธ ๊ธธ์ด๋ฅผ 512์์ 2048๋ก ํ์ฅํ์ฌ GPU ๋ฉ๋ชจ๋ฆฌ ์๊ตฌ ์ฌํญ์ ํฌ๊ฒ ๋๋ฆฝ๋๋ค. ์ฐ๋ฆฌ๋ ๊ทธ๋ผ๋์ธํธ ์ฒดํฌ ํฌ์ธํธ์ ํ๋์ ์ดํ ์ ์ ํ์ฉํ์ฌ ๋ฉ๋ชจ๋ฆฌ ์๋ ฅ์ ํด๊ฒฐํฉ๋๋ค.
- ๋ค์ค ๋ผ์ด๋ ๋ํ: ๋ค์ค ๋ผ์ด๋ ๋ํ๋ฅผ ๊ณ ๋ คํ์ฌ ํ๋ จ ์์ค์ ์กฐ์ ํ๊ณ ์ฑ๋ด์ ์ถ๋ ฅ์ ๋ํด์๋ง ๋ฏธ์ธ ์กฐ์ ์์ค์ ๊ณ์ฐํฉ๋๋ค.
- ์คํ ์ธ์คํด์ค๋ฅผ ํตํ ๋น์ฉ ์ ๊ฐ: 40๋ฐฐ ๋ ํฐ ๋ฐ์ดํฐ ์ธํธ์ 4๋ฐฐ ๋ ํฐ ์ํ์ค ๊ธธ์ด๋ ํ๋ จ ๋น์ฉ์ ์๋นํ ๋ฌธ์ ๋ฅผ ์ ๊ธฐํฉ๋๋ค. SkyPilot ๊ด๋ฆฌํ ์คํ์ ์ฌ์ฉํ์ฌ ์ ์ ๋ฐ ์๋ ์์ญ ์ ํ์ ์ํ ์๋ ๋ณต๊ตฌ ๊ธฐ๋ฅ์ด ์๋ ์ ๋ ดํ ์คํ ์ธ์คํด์ค๋ฅผ ํ์ฉํ์ฌ ๋น์ฉ์ ์ ๊ฐํฉ๋๋ค. ์ด ์๋ฃจ์ ์ 7B ๋ชจ๋ธ์ $500์์ ์ฝ $140๋ก, 13B ๋ชจ๋ธ์ ์ฝ $1K์์ $300๋ก ํ๋ จํ๋ ๋น์ฉ์ ์ ๊ฐํฉ๋๋ค.
Serving
์ฐ๋ฆฌ๋ ๋ถ์ฐ ๋ ์์ ์์ ํจ๊ป ์ฌ๋ฌ ๋ชจ๋ธ์ ์ ๊ณต ํ ์์๋ ์๋น ์์คํ ์ ๊ตฌ์ถํฉ๋๋ค. ์จํ๋ ๋ฏธ์ค ํด๋ฌ์คํฐ์ ํด๋ผ์ฐ๋ ๋ชจ๋์์ GPU ์์ ์์ ์ ์ฐํ ํ๋ฌ๊ทธ์ธ์ ์ง์ํฉ๋๋ค. SkyPilot์ ๋ด๊ฒฐํจ์ฑ ์ปจํธ๋กค๋ฌ ๋ฐ ๊ด๋ฆฌํ ์คํ ๊ธฐ๋ฅ์ ํ์ฉํจ์ผ๋ก์จ ์ด ์๋น ์์คํ ์ ์ฌ๋ฌ ํด๋ผ์ฐ๋์ ์ ๋ ดํ ์คํ ์ธ์คํด์ค์ ์ ์๋ํ์ฌ ์๋น ๋น์ฉ์ ์ ๊ฐํ ์ ์์ต๋๋ค. ํ์ฌ ๊ฒฝ๋ ๊ตฌํ์ด๋ฉฐ ์ต์ ์ฐ๊ตฌ๋ฅผ ๋ ๋ง์ด ํตํฉํ๊ธฐ ์ํด ๋ ธ๋ ฅํ๊ณ ์์ต๋๋ค.
์ฑ๋ด์ ํ๊ฐํ๋ ๋ฐฉ๋ฒ?
AI ์ฑ๋ด์ ํ๊ฐํ๋ ๊ฒ์ ์ธ์ด ์ดํด, ์ถ๋ก ๋ฐ ์ํฉ ์ธ์์ ๊ฒํ ํด์ผ ํ๊ธฐ ๋๋ฌธ์ ์ด๋ ค์ด ์์ ์ ๋๋ค. AI ์ฑ๋ด์ด ๋์ฑ ๋ฐ์ ํจ์ ๋ฐ๋ผ ํ์ฌ์ ๊ณต๊ฐ ๋ฒค์น๋งํฌ๋ก๋ ๋ ์ด์ ์ถฉ๋ถํ์ง ์์ ์ ์์ต๋๋ค. ์๋ฅผ ๋ค์ด, ์คํ ํฌ๋์ ์ํ์นด์์ ์ฌ์ฉ ๋ ํ๊ฐ ๋ฐ์ดํฐ ์ธํธ ์ธ ์๊ธฐ ์ง์๋ SOTA ์ฑ๋ด์ ์ํด ํจ๊ณผ์ ์ผ๋ก ์๋ต ๋ ์ ์์ผ๋ฏ๋ก ์ธ๊ฐ์ด ์ฑ๋ฅ์ ์ฐจ์ด๋ฅผ ์๋ณํ๊ธฐ๊ฐ ์ด๋ ต์ต๋๋ค. ๋ ๋ง์ ์ ํ ์ฌํญ์๋ ๊ต์ก/ํ ์คํธ ๋ฐ์ดํฐ ์ค์ผ๊ณผ ์๋ก์ด ๋ฒค์น๋งํฌ๋ฅผ ๋ง๋๋ ๋ฐ ๋๋ ์ ์ฌ์ ์ผ๋ก ๋์ ๋น์ฉ์ด ํฌํจ๋ฉ๋๋ค. ์ด๋ฌํ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด GPT-4 ๊ธฐ๋ฐ์ ํ๊ฐ ํ๋ ์์ํฌ๋ฅผ ์ ์ํ์ฌ ์ฑ๋ด ์ฑ๋ฅ ํ๊ฐ๋ฅผ ์๋ํํฉ๋๋ค.
๋จผ์ ํ๋ฅด๋ฏธ ๋ฌธ์ , ์ญํ ๊ทน ์๋๋ฆฌ์ค, ์ฝ๋ฉ/์ํ ๊ณผ์ ๋ฑ 4๊ฐ์ง ์ง๋ฌธ ๋ฒ์ฃผ๋ฅผ ๊ณ ์ํด ์ฑ๋ด ์ฑ๋ฅ์ ๋ค์ํ ์ธก๋ฉด์ ํ ์คํธํ์ต๋๋ค. ์ ์คํ ํ๋กฌํํธ ์์ง๋์ด๋ง์ ํตํด GPT-4๋ ๊ธฐ๋ณธ ๋ชจ๋ธ์ด ์ด๋ ค์์ ๊ฒช๋ ๋ค์ํ๊ณ ๋์ ์ ์ธ ์ง๋ฌธ์ ์์ฑํ ์ ์์ต๋๋ค. ์นดํ ๊ณ ๋ฆฌ ๋น 4 ๊ฐ์ ์ง๋ฌธ์ ์ ํํ๊ณ LLaMA, Alpaca, ChatGPT, Bard ๋ฐ Vicuna์ 4 ๊ฐ ์ฑ๋ด์์ ๋ต๋ณ์ ์์งํฉ๋๋ค. ๊ทธ๋ฐ ๋ค์ GPT-<>์ ์ ์ฉ์ฑ, ๊ด๋ จ์ฑ, ์ ํ์ฑ ๋ฐ ์ธ๋ถ ์ ๋ณด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๋ต๋ณ์ ํ์ง์ ํ๊ฐํ๋๋ก ์์ฒญํฉ๋๋ค. ์ฐ๋ฆฌ๋ GPT-<>๊ฐ ๋น๊ต์ ์ผ๊ด๋ ์ ์๋ฅผ ์ฐ์ถ ํ ์์์๋ฟ๋ง ์๋๋ผ ๊ทธ๋ฌํ ์ ์๊ฐ ์ฃผ์ด์ง๋ ์ด์ ์ ๋ํ ์์ธํ ์ค๋ช ์ ์์ฑ ํ ์ ์์์ ๋ฐ๊ฒฌํ์ต๋๋ค (์์ธํ ์์ ๋งํฌ). ๊ทธ๋ฌ๋ GPT-<>๋ ์ฝ๋ฉ / ์ํ ์์ ์ ํ๋จํ๋ ๋ฐ ๊ทธ๋ค์ง ์ข์ง ์์ต๋๋ค.

๊ทธ๋ฆผ 3์ ๋ชจ๋ ๊ธฐ์ค์ ๊ณผ Vicuna ๊ฐ์ ๋น๊ต ๊ฒฐ๊ณผ๋ฅผ ๋ณด์ฌ์ค๋๋ค. GPT-4๋ ์ง๋ฌธ์ 90% ์ด์์์ ์ต์ฒจ๋จ ์คํ ์์ค ๋ชจ๋ธ(LLaMA, Alpaca)๋ณด๋ค Vicuna๋ฅผ ์ ํธํ๋ฉฐ ๋ ์ ๋ชจ๋ธ(ChatGPT, Bard)์ ๋นํด ๊ฒฝ์๋ ฅ ์๋ ์ฑ๋ฅ์ ๋ฌ์ฑํฉ๋๋ค. ์ง๋ฌธ์ 45%์์ GPT-4๋ Vicuna์ ์๋ต์ ChatGPT์ ์๋ต๋ณด๋ค ์ข๊ฑฐ๋ ๋๋ฑํ๋ค๊ณ ํ๊ฐํฉ๋๋ค. GPT-4๋ 10์ ์ฒ๋๋ก ๊ฐ ์๋ต์ ์ ๋์ ์ ์๋ฅผ ํ ๋นํ๋ฏ๋ก 80๊ฐ์ ์ง๋ฌธ์ ๋ํด ๊ฐ ๋ชจ๋ธ์์ ์ป์ ์ ์๋ฅผ ํฉ์ฐํ์ฌ ๊ฐ (๊ธฐ์ค์ , Vicuna) ๋น๊ต ์์ ์ด์ ์ ๊ณ์ฐํฉ๋๋ค. ํ 2์์ ๋ณผ ์ ์๋ฏ์ด Vicuna์ ์ด ์ ์๋ ChatGPT์ 92%์ ๋๋ค. ์ต๊ทผ์ ๋ฐ์ ์๋ ๋ถ๊ตฌํ๊ณ ์ด๋ฌํ ์ฑ๋ด์ ๊ธฐ๋ณธ์ ์ธ ์ํ ๋ฌธ์ ๋ก ์ด๋ ค์์ ๊ฒช๊ฑฐ๋ ์ฝ๋ฉ ๋ฅ๋ ฅ์ด ์ ํ๋๋ ๋ฑ ์ฌ์ ํ ํ๊ณ์ ์ง๋ฉดํด ์์ต๋๋ค.
Table 2. Total Scores Assessed by GPT-4.
Baseline | Baseline Score | Vicuna Score |
LLaMA-13B | 513.0 | 694.0 |
Alpaca-13B | 583.0 | 704.0 |
Bard | 664.0 | 655.5 |
ChatGPT | 693.0 | 638.0 |
์ด ์ ์๋ ํ๊ฐ ํ๋ ์์ํฌ๋ ์ฑ๋ด์ ํ๊ฐํ ์ ์๋ ๊ฐ๋ฅ์ฑ์ ๋ณด์ฌ์ฃผ์ง๋ง, ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ์ ํ๊ฐ์ ์ผ์ผํค๊ธฐ ์ฝ๊ธฐ ๋๋ฌธ์ ์์ง ์๊ฒฉํ๊ฑฐ๋ ์ฑ์ํ ์ ๊ทผ ๋ฐฉ์์ ์๋๋๋ค. ์ฑ๋ด์ ๋ํ ํฌ๊ด์ ์ด๊ณ ํ์คํ๋ ํ๊ฐ ์์คํ ์ ๊ฐ๋ฐํ๋ ๊ฒ์ ์ถ๊ฐ ์ฐ๊ตฌ๊ฐ ํ์ํ ๋ฏธํด๊ฒฐ ์ง๋ฌธ์ผ๋ก ๋จ์ ์์ต๋๋ค.
Limitations
์ฐ๋ฆฌ๋ ๋ค๋ฅธ ๋ํ ์ธ์ด ๋ชจ๋ธ๊ณผ ๋ง์ฐฌ๊ฐ์ง๋ก Vicuna์๋ ํน์ ์ ํ ์ฌํญ์ด ์์์ ๋ฐ๊ฒฌํ์ต๋๋ค. ์๋ฅผ ๋ค์ด, ์ถ๋ก ์ด๋ ์ํ๊ณผ ๊ด๋ จ๋ ์์ ์ ๋ฅ์ํ์ง ์์ผ๋ฉฐ ์์ ์ ์ ํํ๊ฒ ์๋ณํ๊ฑฐ๋ ์ถ๋ ฅ์ ์ฌ์ค์ ์ ํ์ฑ์ ๋ณด์ฅํ๋ ๋ฐ ํ๊ณ๊ฐ์์ ์ ์์ต๋๋ค. ๋ํ ์์ ์ฑ์ ๋ณด์ฅํ๊ฑฐ๋ ์ ์ฌ์ ์ธ ๋ ์ฑ ๋๋ ํธํฅ์ ์ํํ ์ ์์ ๋งํผ ์ถฉ๋ถํ ์ต์ ํ๋์ง ์์์ต๋๋ค. ์์ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด OpenAI ์กฐ์ API๋ฅผ ์ฌ์ฉํ์ฌ ์จ๋ผ์ธ ๋ฐ๋ชจ์์ ๋ถ์ ์ ํ ์ฌ์ฉ์ ์ ๋ ฅ์ ํํฐ๋งํฉ๋๋ค. ๊ทธ๋ผ์๋ ๋ถ๊ตฌํ๊ณ ์ฐ๋ฆฌ๋ Vicuna๊ฐ ์ด๋ฌํ ํ๊ณ๋ฅผ ํด๊ฒฐํ๊ธฐ์ํ ํฅํ ์ฐ๊ตฌ๋ฅผ์ํ ์ด๋ฆฐ ์ถ๋ฐ์ ์ด ๋ ๊ฒ์ผ๋ก ๊ธฐ๋ํฉ๋๋ค.
Release
์ฒซ ๋ฒ์งธ ๋ฆด๋ฆฌ์ค์์๋ GitHub ๋ฆฌํฌ์งํ ๋ฆฌ์์ ํ์ต, ์๋น์ค ๋ฐ ํ๊ฐ ์ฝ๋๋ฅผ ๊ณต์ ํฉ๋๋ค. https://github.com/lm-sys/FastChat. ์๋ LLaMA ๊ฐ์ค์น๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ๋ ๋ธํ ๊ฐ์ค์น ๋ฒ์ ์ ์ ๊ณตํ์ฌ ๋ชจ๋ธ ๊ฐ์ค์น๋ฅผ ๋ฆด๋ฆฌ์คํ ๊ณํ์ด์ง๋ง ์ฌ์ ํ ์ ์ ํ ๋ฐฉ๋ฒ์ ์ฐพ๊ณ ์์ต๋๋ค. ๋ฐ์ดํฐ ์ธํธ๋ฅผ ํด์ ํ ๊ณํ์ ์์ต๋๋ค. Discord ์๋ฒ์ ๊ฐ์ ํ๊ณ ํธ์ํฐ๋ฅผ ํ๋ก์ฐ ํ์ฌ ์ต์ ์ ๋ฐ์ดํธ๋ฅผ ๋ฐ์ผ์ธ์.
License
์จ๋ผ์ธ ๋ฐ๋ชจ๋ LLaMA์ ๋ชจ๋ธ ๋ผ์ด์ ์ค, OpenAI์์ ์์ฑ๋ ๋ฐ์ดํฐ์ ์ด์ฉ ์ฝ๊ด ๋ฐ ShareGPT์ ๊ฐ์ธ ์ ๋ณด ๋ณดํธ ๊ดํ์ ๋ฐ๋ผ ๋น์์
์ ์ฉ๋๋ก๋ง ์ฌ์ฉํ ์ ์๋ ์ฐ๊ตฌ ๋ฏธ๋ฆฌ๋ณด๊ธฐ์
๋๋ค. ์ ์ฌ์ ์ธ ์๋ฐ ์ฌํญ์ ๋ฐ๊ฒฌํ๋ฉด ๋น์ฌ์ ๋ฌธ์ํ์ญ์์ค.
์ฝ๋๋ Apache ๋ผ์ด์ ์ค 2.0์ ๋ฐ๋ผ ๋ฆด๋ฆฌ์ค๋ฉ๋๋ค.
The Team
์ด๊ฒ์ UC Berkeley, CMU, Stanford, UC San Diego ๋ฐ MBZUAI๋ฅผ ํฌํจํ ์ฌ๋ฌ ๊ธฐ๊ด์ ๊ณต๋ ์์ ์์์ ๊ณต๋ ๋ ธ๋ ฅ์ ๋๋ค.
Students (alphabetical order):
Wei-Lin Chiang, Zhuohan Li, Zi Lin, Ying Sheng, Zhanghao Wu, Hao Zhang, Lianmin Zheng, Siyuan Zhuang, Yonghao Zhuang
Advisors (alphabetical order):
Joseph E. Gonzalez, Ion Stoica, Eric P. Xing
Acknowledgment
BAIR์ Xinyang Geng, Hao Liu ๋ฐ Eric Wallace์๊ฒ ๊ฐ์ฌ๋๋ฆฝ๋๋ค. Xuecheng Li์ ์คํ ํฌ๋ ์ํ์นด ํ์ Tianyi Zhang์ ํต์ฐฐ๋ ฅ์๋ ํ ๋ก ๊ณผ ํผ๋๋ฐฑ์ ์ ๊ณตํฉ๋๋ค. BAIR๋ ์ฑ๋ด Koala์ ๋ํ ๋์ ์์ ์ ์ํด ๊ณง ๋ ๋ค๋ฅธ ๋ธ๋ก๊ทธ ๊ฒ์๋ฌผ์ ์ฌ๋ฆด ์์ ์ ๋๋ค.
Vicuna: An Open-Source Chatbot Impressing GPT-4 with 90%* ChatGPT Quality
by the Team with members from UC Berkeley, CMU, Stanford, and UC San Diego
vicuna.lmsys.org
github : lm-sys/FastChat: The release repo for "Vicuna: An Open Chatbot Impressing GPT-4" (github.com)
GitHub - lm-sys/FastChat: The release repo for "Vicuna: An Open Chatbot Impressing GPT-4"
The release repo for "Vicuna: An Open Chatbot Impressing GPT-4" - GitHub - lm-sys/FastChat: The release repo for "Vicuna: An Open Chatbot Impressing GPT-4"
github.com