Tác giả: lethuha

o Dual-Axis Scaling: dùng hai vector tỷ lệ riêng biệt cho hàng và cột, giúp giảm lỗi lượng tử hóa do giá trị ngoại lai. o Sinkhorn-Knopp Normalization: thuật toán chuẩn hóa nhanh giúp giảm “matrix imbalance” – chỉ số mới hiệu quả hơn kurtosis trong tối ưu hóa chất lượng lượng tử hóa. 📌 Với phương pháp lượng tử hóa mới SINQ, Huawei đang dân chủ hóa khả năng chạy LLM trên phần cứng phổ thông, giúp tiết kiệm 60–70% bộ nhớ và chi phí GPU giảm tới 3 lần. Giải pháp nguồn mở, nhanh, dễ dùng và không…

Read More

KT khẳng định tiếp tục chiến lược song song: vừa phát triển Mi:dm, vừa dùng API của Big Tech. 📌 Việc KT và Kakao bị loại khỏi dự án AI 200 tỷ won (tương đương 145 triệu USD) cho thấy Hàn Quốc ưu tiên “AI tự chủ” thay vì mô hình phụ thuộc Big Tech. Chính phủ nhấn mạnh “tự chủ từ kiến trúc đến huấn luyện” là yêu cầu, không chỉ tùy biến mô hình nước ngoài. Trong khi Naver, LG, SK Telecom tiến nhanh nhờ nền tảng riêng, hai “ông lớn” này sẽ phải cân nhắc giảm phụ…

Read More