Huawei ra mắt DeepSeek-R1-Safe: AI chặn nội dung nhạy cảm chính trị với hiệu quả 83%

Huawei công bố DeepSeek-R1-Safe, phiên bản AI tập trung vào an toàn, được thiết kế để chặn nội dung nhạy cảm chính trị và ngôn ngữ độc hại. Dự án phát triển cùng Đại học Chiết Giang, nơi sáng lập DeepSeek Liang Wenfeng từng học, nhưng Huawei khẳng định ông Liang và DeepSeek không trực tiếp tham gia.
Hệ thống được huấn luyện trên 1.000 chip Ascend do Huawei sản xuất, dựa trên nền tảng nguồn mở DeepSeek-R1 nhưng điều chỉnh để tuân thủ quy định của Bắc Kinh, bảo đảm AI phản ánh “giá trị xã hội chủ nghĩa” và tuân thủ kiểm soát ngôn luận trực tuyến.
Trong các thử nghiệm, DeepSeek-R1-Safe đạt tỷ lệ gần 100% trong việc ngăn phản hồi liên quan đến chính trị nhạy cảm, ngôn ngữ độc hại và hoạt động phi pháp. Tuy nhiên, trong các tình huống phức tạp như roleplay, thử thách kịch bản hoặc mã hóa, hiệu quả giảm còn 40%.
Huawei báo cáo hệ thống đạt điểm phòng thủ an ninh tổng thể 83%, cao hơn 8–15% so với Alibaba Qwen-235B và DeepSeek-R1-671B khi cùng điều kiện kiểm thử. Đáng chú ý, các biện pháp an toàn bổ sung chỉ làm giảm hiệu suất dưới 1% so với bản gốc.
Sự ra mắt diễn ra trong bối cảnh Trung Quốc đẩy mạnh áp dụng công nghệ DeepSeek. Sau khi R1 và V3 ra mắt đầu 2025, thị trường phương Tây đã chao đảo, gây bán tháo cổ phiếu AI ở Silicon Valley.
Nhiều nền tảng AI nội địa như Baidu Ernie Bot vốn đã hạn chế phản hồi về các chủ đề chính trị, và DeepSeek-R1-Safe được xem như bước đi tiếp theo nhằm thể chế hóa các giới hạn này trong các hệ thống AI tiên tiến.
Sự kiện ra mắt trùng với hội nghị thường niên Huawei Connect tại Thượng Hải, nơi công ty cũng công bố lộ trình chip và hạ tầng tính toán mới, hé lộ tham vọng bán dẫn sau nhiều năm giữ kín.

📌 Với DeepSeek-R1-Safe, Huawei đang định vị AI an toàn theo định hướng chính trị, đạt 83% điểm phòng thủ và vượt Alibaba Qwen-235B từ 8–15%. Trong các thử nghiệm, DeepSeek-R1-Safe đạt tỷ lệ gần 100% trong việc ngăn phản hồi liên quan đến chính trị nhạy cảm, ngôn ngữ độc hại và hoạt động phi pháp. Tuy nhiên, trong các tình huống phức tạp như đóng vai, thử thách kịch bản hoặc mã hóa, hiệu quả giảm còn 40%. Hệ thống được huấn luyện trên 1.000 chip Ascend của Huawwei, cho thấy tham vọng củng cố vị thế AI và bán dẫn của Trung Quốc.

Tổng hợp.

What's Hot

Trung Quốc sắp siết AI nguồn mở: Tác giả kêu gọi Mỹ đáp trả bằng cách mở AI, không phải cấm AI Trung Quốc

Moonshot AI bị cáo buộc sử dụng chip Nvidia dù bị cấm: Cuộc đua AI Mỹ – Trung tiếp tục leo thang

Nhật Bản thử nghiệm “nhân viên AI”: AI không chỉ hỗ trợ mà bắt đầu làm việc như một đồng nghiệp

Huawei ra mắt DeepSeek-R1-Safe: AI chặn nội dung nhạy cảm chính trị với hiệu quả 83%

Trung Quốc sắp siết AI nguồn mở: Tác giả kêu gọi Mỹ đáp trả bằng cách mở AI, không phải cấm AI Trung Quốc

Moonshot AI bị cáo buộc sử dụng chip Nvidia dù bị cấm: Cuộc đua AI Mỹ – Trung tiếp tục leo thang

Nhật Bản thử nghiệm “nhân viên AI”: AI không chỉ hỗ trợ mà bắt đầu làm việc như một đồng nghiệp

Trung Quốc sắp siết AI nguồn mở: Tác giả kêu gọi Mỹ đáp trả bằng cách mở AI, không phải cấm AI Trung Quốc

Moonshot AI bị cáo buộc sử dụng chip Nvidia dù bị cấm: Cuộc đua AI Mỹ – Trung tiếp tục leo thang

Nhật Bản thử nghiệm “nhân viên AI”: AI không chỉ hỗ trợ mà bắt đầu làm việc như một đồng nghiệp

Cơn sốt AI tạo ra những người thắng cuộc bất ngờ tại Nhật Bản: Hãng bồn cầu, sợi thủy tinh và bột ngọt cùng hưởng lợi từ chip AI

Liên hệ:

What's Hot

Huawei ra mắt DeepSeek-R1-Safe: AI chặn nội dung nhạy cảm chính trị với hiệu quả 83%

Related Posts

Liên hệ: