OpenAI vừa phát hành hai phiên bản mô hình ngôn ngữ mã nguồn mở (LLM) cực mạnh: GPT‑OSS 120B và GPT‑OSS 20B. Không cần trả phí. Không cần internet. Không giới hạn câu hỏi. Bạn có thể tự chạy mô hình ChatGPT miễn phí ngay trên máy của mình, nhờ OpenAI vừa ra mắt bộ mô hình mã nguồn mở tên là GPT-OSS.

 LỢI ÍCH KHI DÙNG CÁCH NÀY

  • Miễn phí trọn đời
  • Không cần đăng nhập OpenAI
  • Không giới hạn lượt hỏi, không bị timeout
  • An toàn – dữ liệu không bị gửi lên server nào cả
  • Có thể dùng để viết văn, viết code, làm bài, sáng tạo nội dung
Lưu ý: Yêu cầu phần cứng tối thiểu
  • Tối thiểu 16GB RAM
  • Tốt nhất nên có card đồ họa (GPU) của NVIDIA hoặc AMD (dùng CPU cũng được nhưng sẽ rất chậm)
  • Dung lượng trống ~20GB trở lên
  • Máy dùng Windows, macOS hoặc Ubuntu đều được
 Làm sao để tự tải GPT-OSS về và tự chạy ChatGPT (rất dễ):

Có rất nhiều cách khác nhau để tự host một model, thí dụ như tự host trên máy tính bằng LMStudio, xài Ollama, tự host riêng,.. Bài này là mình tham khảo từ bạn ND Minh Đức trên Tinhte, hướng dẫn mọi người cách dùng Ollama làm back end – bộ não, và xài OpenUI làm front end – giao diện để mọi người chạy thử. Tại sao mình chọn cách này? Vì nó không quá phức tạp, bạn chỉ cần cài đúng vài cái trước để tạo môi trường trên máy cho nó chạy và sau đó là có thể xài ChatGPT gần như là trên bản online.

 BƯỚC 1: Cài đặt các công cụ nền tảng:

Bạn cần cài 3 công cụ sau. Cứ vào link, tải về và cài đặt như các phần mềm bình thường.

1. Cài Python (Ngôn ngữ lập trình):

Vào trang https://www.python.org/downloads/.

Tải về phiên bản 3.11.x.

LƯU Ý CỰC KỲ QUAN TRỌNG: Khi cửa sổ cài đặt hiện ra, bạn hãy nhìn xuống dưới cùng và nhớ tick vào ô có chữ “Add Python to PATH” trước khi bấm “Install Now”. Việc này giúp máy tính của bạn biết cách tìm và sử dụng Python sau này.

2. Cài Node.js (Công cụ làm giao diện):

Vào trang https://nodejs.org/en.

Luôn chọn phiên bản có chữ LTS (Recommended For Most Users) để tải về và cài đặt.

3. Cài Git (Công cụ tải mã nguồn):

Vào trang https://git-scm.com/downloads.

Tải về và cài đặt. Ở các bước cài đặt, bạn không cần thay đổi gì, cứ bấm “Next” liên tục là được.

 BƯỚC 2: Cài đặt “Bộ Não” AI (Ollama)

Bây giờ chúng ta sẽ cài đặt chương trình chính để chạy AI.

1. Tải và cài Ollama:

Truy cập trang chủ https://ollama.com/.

Bấm nút Download và chọn phiên bản cho Windows hoặc macOS.

Cài đặt file vừa tải về như một phần mềm bình thường.

2. Mở “Cửa sổ dòng lệnh”:

Đây là một công cụ có sẵn trên máy tính, trông như một màn hình đen hoặc trắng chỉ có chữ. Bạn sẽ gõ lệnh vào đây để ra lệnh cho máy tính.

Trên Windows: Bấm nút Start (biểu tượng cửa sổ), gõ chữ cmd rồi nhấn Enter.

Trên macOS: Mở thư mục Applications > Utilities > và chọn ứng dụng tên là Terminal.

3. Kiểm tra Ollama đã cài thành công chưa:

Trong cửa sổ dòng lệnh vừa mở, bạn gõ chính xác lệnh sau rồi nhấn Enter: ollama –version

Nếu màn hình hiện ra một dòng chữ có số phiên bản (ví dụ ollama version is 0.1.32), nghĩa là bạn đã thành công!

4. Tải “bộ não” AI về máy:

Vẫn trong cửa sổ dòng lệnh đó, bạn gõ tiếp lệnh sau: ollama pull gpt-oss:20b để bắt đầu tải mô hình AI về.

LƯU Ý:

Bạn cần có kết nối Internet để thực hiện bước này.

Bộ não này rất lớn (khoảng 13GB), nên quá trình tải sẽ RẤT LÂU, có thể từ 30 phút đến vài giờ tùy tốc độ mạng.

Bạn sẽ thấy các dòng chữ và thanh tiến trình chạy. Hãy kiên nhẫn và đừng tắt cửa sổ dòng lệnh đi cho đến khi nó tự dừng lại và bạn có thể gõ lệnh mới.

 BƯỚC 3: Cài giao diện để dùng

1. Cài đặt giao diện:

Mở một cửa sổ dòng lệnh mới (làm lại điều 2 của Bước 2).

Gõ lệnh “pip install open-webui” để cài đặt Open WebUI. Lệnh này sử dụng pip, một công cụ được cài kèm với Python ở Bước 1. Chờ một lát để máy tính tự động tải và cài đặt.

2. Khởi động giao diện web:

Sau khi cài xong, vẫn tại cửa sổ đó, bạn gõ lệnh “open-webui serve” để “bật” trang web trò chuyện lên: open-webui serve

LƯU Ý: Bạn sẽ thấy vài dòng chữ hiện ra. Đừng tắt cửa sổ dòng lệnh này đi, nó phải luôn chạy thì bạn mới dùng giao diện web được.

3. Truy cập và sử dụng:

Mở trình duyệt web bạn hay dùng, trên thanh địa chỉ, gõ chính xác địa chỉ sau và nhấn Enter:

http://localhost:8080

  • Giải thích: localhost có nghĩa là “máy tính của chính bạn”, :8080 là “cổng” mà chương trình đang chạy. Đây là một trang web chạy riêng trên máy bạn chứ không phải trên Internet.
  • Lần đầu tiên truy cập, trang web sẽ yêu cầu bạn đăng ký một tài khoản. Bạn cứ điền email và mật khẩu bất kỳ để tạo (đây là tài khoản dùng riêng trên máy bạn).
  • Sau khi đăng nhập, ở giao diện chính, bấm vào mục “Select a model” (Chọn một mô hình) ở phía trên, bạn sẽ thấy mô hình gpt-oss:20b mà mình đã tải. Hãy chọn nó.

Tới đây rồi thì giao diện trò chuyện với AI giống hệt ChatGPT sẽ hiện ra. Bắt đầu hỏi bất kỳ điều gì bạn muốn nhớ! ️🎉️🎉

——

Tại sao nó quan trọng (và hay) dữ vậy?

Đây là bước ngoặt lớn vì trước nay OpenAI luôn đi theo hướng “đóng”, giữ kín mã nguồn và dữ liệu mô hình, dù ban đầu từng đặt mục tiêu phát triển AI mở cho mọi người. Trong bối cảnh các mô hình mã nguồn mở từ Trung Quốc (như DeepSeek, Qwen) và phương Tây (LLaMA của Meta, Mistral, Gemma của Google) đang ngày càng mạnh mẽ, OpenAI cuối cùng cũng “mở cửa”.

GPT‑OSS gồm 2 phiên bản: GPT‑OSS‑120B (cực mạnh nhưng cần máy GPU khủng), và GPT‑OSS‑20B là phiên bản nhẹ hơn, phù hợp với máy tính phổ thông, chỉ cần 16GB RAM là chạy được. Đáng chú ý, cả hai đều được phát hành dưới giấy phép Apache 2.0, nghĩa là người dùng có thể tải về, tự chạy trên máy, tinh chỉnh, dùng cho mục đích cá nhân hoặc thương mại mà không bị ràng buộc.

Điều tuyệt vời là khi bạn tự host mô hình GPT‑OSS, bạn sẽ kiểm soát hoàn toàn dữ liệu – không còn nỗi lo bị “nghe lén” hay dùng dữ liệu để huấn luyện lại như nhiều mô hình online. Ngoài ra, bạn có thể dùng ChatGPT theo cách của riêng mình mà không cần trả phí API hay phụ thuộc vào server của OpenAI. Đặc biệt, GPT‑OSS còn đi kèm bộ tokenizer (bẻ từ) cực kỳ tối ưu, hỗ trợ tốt cho tiếng Việt nhờ dùng hệ ký tự Latin – điều này giúp bạn không cần tinh chỉnh riêng cho ngôn ngữ như trước.

Tóm lại, GPT‑OSS là cú hích cực lớn: bạn có thể dùng AI giống ChatGPT, hoàn toàn miễn phí, riêng tư, không giới hạn và tùy biến theo ý mình – ngay trên máy tính cá nhân. Một bước tiến rất đáng giá cho tương lai AI mở.

Nguồn: Internet