https://www.facebook.com/1072129415975076/

GlassBox AI, Cầu Giấy, Hanoi (2026)

28/05/2026

Nguyên hàm là gì? Và mối quan hệ của nó với tích phân?

26/05/2026

AI đang bước vào một giai đoạn mới trong toán học.

Google DeepMind vừa công bố AlphaProof Nexus — một hệ thống dùng mô hình ngôn ngữ lớn kết hợp với Lean, công cụ kiểm chứng chứng minh toán học bằng máy.

Kết quả đáng chú ý: AlphaProof Nexus giải được 9/353 bài toán Erdős mở mà hệ thống đã thử, trong đó có 2 bài đã mở khoảng 56 năm. Ngoài ra, nó còn chứng minh được 44/492 conjecture từ OEIS. Những proof này không chỉ là lời giải dạng văn bản, mà là các chứng minh hình thức có thể được Lean kiểm tra từng bước.

Điểm quan trọng nằm ở chỗ:
AI không chỉ “nói ra một lời giải nghe có vẻ đúng”. Nó phải viết proof trong Lean. Nếu sai, Lean báo lỗi. AI tiếp tục sửa. Chỉ khi proof compile được, không còn phần bỏ trống kiểu sorry, và theorem gốc không bị thay đổi thì kết quả mới được chấp nhận. Paper mô tả rõ cơ chế này: LLM sinh/sửa proof, Lean compiler phản hồi lỗi, rồi agent lặp lại quá trình đó.

Nói đơn giản dễ hiểu thì như sau:

AI đề xuất proof
→ Lean kiểm tra logic
→ sai thì trả lỗi
→ AI sửa tiếp
→ đúng thì proof được xác nhận hình thức

Đây là bước tiến lớn vì điểm yếu lâu nay của LLM trong toán học là ảo giác logic: lời giải có thể rất thuyết phục nhưng sai ở một mắt xích nhỏ. Terence Tao từng cảnh báo rằng AI thường “giỏi tạo cảm giác đúng hơn là thật sự đúng”, và ông cũng nói nếu buộc AI tạo output trong ngôn ngữ được kiểm chứng hình thức thì về nguyên tắc có thể giải quyết phần lớn vấn đề này.

Kevin Buzzard, một trong những người nổi bật trong cộng đồng Lean, cũng nhấn mạnh hướng kết hợp AI với Lean: để AI viết ra output, dịch nó sang Lean, cho Lean kiểm tra, rồi dùng lỗi từ Lean để AI sửa tiếp.

Vì vậy, ý nghĩa thật sự của AlphaProof Nexus không chỉ là “AI giải được 9 bài toán”. Ý nghĩa lớn hơn là nó cho thấy một mô hình làm toán mới đang hình thành:

AI sinh ý tưởng
+ máy kiểm chứng logic
+ con người formalize, định hướng và hiểu ý nghĩa toán học.

P/s: Vài năm trước, cuộc đua chủ yếu là: model nào nói tự nhiên hơn, viết code tốt hơn, làm benchmark cao hơn. Nhưng các tín hiệu gần đây cho thấy xu hướng đang sâu hơn: AI không chỉ sinh văn bản, mà được gắn vào tool, verifier, compiler, proof assistant, simulator, environment để kiểm tra kết quả của chính nó.

26/05/2026

Bản chất của ma trận

21/05/2026

AI vừa tạo ra một cú sốc thật sự trong toán học.

Không phải kiểu “AI giải được bài toán cấp 3”, cũng không phải “AI search ra một ví dụ lạ”. Lần này, một mô hình nội bộ của OpenAI được cho một bài toán hình học rời rạc nổi tiếng từ thời Paul Erdős, và nó đã đưa ra một chứng minh bác bỏ phỏng đoán tồn tại gần 80 năm - điều mà trước đó các nhà toán học trên thế giới vẫn ngầm tin tưởng.

Bài toán nghe rất đơn giản:

Cho n điểm trên mặt phẳng. Hỏi nhiều nhất có thể có bao nhiêu cặp điểm cách nhau đúng 1 đơn vị?

Ví dụ bạn chấm n điểm lên giấy. Cứ hai điểm nào cách nhau đúng 1 thì tính là một “unit distance”. Erdős từng phỏng đoán rằng số cặp như vậy không thể tăng nhanh hơn quá nhiều so với tuyến tính, cụ thể gần dạng:

n^(1 + C / log log n)

Nhưng paper mới của OpenAI chứng minh điều ngược lại.

Họ chứng minh tồn tại một hằng số δ > 0 sao cho với vô hạn nhiều giá trị n, ta có thể dựng tập n điểm trên mặt phẳng với ít nhất:

n^(1 + δ)

cặp điểm cách nhau đúng 1.

Nói cách khác: đây không phải một phản ví dụ lẻ. Đây là một chứng minh xây dựng cả một họ vô hạn phản ví dụ. Và Vì thế phỏng đoán của Erdős bị bác bỏ.

Điểm thú vị nhất là lời giải gần như không giống một bài hình học trực quan.

Thay vì chỉ vẽ điểm trên lưới 2D, paper đi một đường rất sâu qua number theory: xây các tower vô hạn của trường số totally real, dùng Golod–Shafarevich theory, Chebotarev, class number bound, rồi biến các cấu trúc số học đó thành lattice nhiều chiều. Sau đó cắt lattice bằng các “cửa sổ” hình học và chiếu xuống một tọa độ phức để thu được tập điểm trong mặt phẳng.

Đây là lý do paper này nặng. Đề bài học sinh cũng hiểu được, nhưng chứng minh thì ở tầm nghiên cứu cao (khoảng trên PhD/ postdoc), pha giữa discrete geometry, rất nặng về algebraic number theory, class field theory và lattice geometry.

Đây là một kết quả rất mạnh, nếu cộng đồng tiếp tục xác nhận đầy đủ thì nó là một "milestone" thật sự cho AI trong nghiên cứu toán. Không phải vì AI “thay nhà toán học”, mà vì nó cho thấy AI có thể đề xuất một hướng chứng minh lạ, nối những vùng toán rất xa nhau, rồi con người kiểm chứng, viết lại và làm chặt hơn.

P/s: Companion paper trên arXiv do Noga Alon, Thomas Bloom, Tim Gowers, Will Sawin, Melanie Matchett Wood… viết có abstract nói họ trình bày một bản “short, digested, human-verified version” của counterexample do OpenAI tạo ra. Đây là bằng chứng độc lập rất mạnh rằng cộng đồng toán không chỉ “nghe OpenAI nói” mà đã viết lại/kiểm tra nghiêm túc.

21/05/2026

Bạn có thực sự hiểu hết về K Nearest Neighbors?

20/05/2026

Gemini 3.5: Frontier Intelligence With Action

Google vừa bước sâu hơn vào “agentic AI era” với Gemini 3.5 Flash — model mới tập trung vào coding, agent, workflow dài và xử lý tác vụ thực tế. Theo Google, model này hiện đã có trong Gemini app, AI Mode trong Search, Google Antigravity, Gemini API, AI Studio và Gemini Enterprise. Điểm đáng chú ý là Flash không chỉ nhanh/rẻ hơn, mà còn được Google định vị như model đủ mạnh cho các agent làm việc nhiều bước: đọc tài liệu, viết code, gọi tool, xử lý workflow dài.

Bên cạnh đó, Google cũng giới thiệu Gemini Omni Flash, một model tạo/chỉnh video đa phương thức: có thể nhận text, ảnh, video, audio làm input rồi tạo video mới. Đây là hướng rất đáng chú ý vì nó không chỉ là text-to-video, mà là “any input to video”.

Tuy nhiên, so với Gemini 3 Flash cũ, bản 3.5 này đang đắt hơn khoảng 3 lần.

18/05/2026

Confusion Matrix là gì?

14/05/2026

Vector trong AI quan trọng thế nào?

10/05/2026

Tích phân là gì?

06/05/2026

Tại sao không dùng MSE cho bài toán phân loại?

03/05/2026

Hồi quy tuyến tính trong mắt của Đại số tuyến tính như thế nào?

GlassBox AI

Share

Category

Website

Address