[AI] gemma-4-31b-it vllm FP8+int4 3์ข
๋น๊ต (AutoRound, AWQ cyanwiki, AWQ QuantTrio)
ยท
IT/AI
gemma-4-31b-it vllm FP8+int4 3์ข
๋น๊ต (AutoRound, AWQ cyanwiki, AWQ QuantTrio)gemma-4-31b-it ๊ฐ ๋ง์์ ๋ค์ด์ ๊ณ์ ์จ๋ณด๋ค ๋ณด๋,๊ทธ๋๋ง ๊ด์ฐฎ์ ์์ํ ๋ชจ๋ธ์ ์จ๋ณด๊ณ ์ถ์ด์ ์ด๊ฒ์ ๊ฒ ๋ฐ์ ํ
์คํธ ํด๋ดค์ต๋๋ค.ํ
์คํธ ๋ชจ๋ธRedHatAI/gemma-4-31B-it-FP8-blockQuantTrio/gemma-4-31B-it-AWQIntel/gemma-4-31B-it-int4-AutoRoundcyankiwi/gemma-4-31B-it-AWQ-4bitFP8-block ์ per-channel์ด๋ per-tensor scale์ ์ฌ์ฉํ๋ FP8-Dynamic๊ณผ ๋ฌ๋ฆฌ ๋ธ๋ก์ค์ผ์ผ์ ์ฌ์ฉํฉ๋๋ค.๊ธฐ๋ณธ ๋ธ๋ก์ 128x128์ด๋ค์. ์๋ฌด๋๋ FP8-Dynami..