TinySearch — thu nhỏ web research cho LLM nội bộ mà không phải dựng cả search stack - Open Source

Điểm nổi bật

Stars: khoảng 18 stars khi quét; tín hiệu discovery đi kèm Show HN trong đúng khung giờ.
Giá trị cốt lõi: biến truy cập web thành một pipeline search → crawl → rerank → grounded prompt.
Kiến trúc triển khai: hỗ trợ cả MCP server và FastAPI, phù hợp cho local agents và prototype nội bộ.
Điểm khác biệt: không cố trả lời thay LLM; nó chỉ trả về prompt có dẫn nguồn để model trả lời dựa trên bằng chứng.

Biểu đồ

flowchart LR A[User query] --> B[Search web] B --> C[Crawl trang tốt nhất] C --> D[Rerank chunk liên quan] D --> E[Build grounded prompt] E --> F[LLM trả lời kèm nguồn]

Tóm tắt

TinySearch đánh vào một khoảng trống khá thực tế trong hệ sinh thái agent hiện nay. Rất nhiều đội muốn agent có khả năng nghiên cứu web, nhưng hai lựa chọn phổ biến đều không tối ưu: hoặc dựa vào search API trả kết quả nông, hoặc tự dựng một stack crawling và ranking phức tạp vượt quá nhu cầu. TinySearch đi con đường trung gian: giữ mọi thứ nhẹ, local-first và tập trung vào việc trả về prompt đã được grounding chứ không cố trở thành một công cụ search quy mô lớn.

Điểm làm dự án đáng chú ý là cách nó đóng khung giá trị. TinySearch không hứa thay thế search engine hay indexer thương mại. Nó tập trung vào một việc nhỏ hơn nhưng hữu dụng hơn cho agent: giúp model thấy đúng những đoạn nội dung liên quan nhất, còn giữ nguyên source URL để câu trả lời vẫn có thể kiểm chứng.

Chi tiết

README của TinySearch mô tả khá rõ pipeline hoạt động. Đầu tiên hệ thống lấy truy vấn người dùng, thực hiện tìm kiếm web, sau đó lọc và xếp hạng kết quả bằng kết hợp dense ranking với BM25 theo cơ chế weighted reciprocal rank fusion. Những trang tốt nhất sẽ được crawl, chuyển sang markdown, cắt chunk, rồi tiếp tục rerank ở cấp chunk trước khi áp quota nguồn và ghép thành một prompt có dẫn chứng. Cách đi này rất hợp với nhu cầu agentic research thực tế: thay vì nhét cả trang web vào context, chỉ giữ những đoạn có khả năng trả lời câu hỏi.

Một điểm mạnh khác là TinySearch phân biệt rất rõ vai trò của nó với vai trò của model. Dự án nhấn mạnh rằng nó không trực tiếp trả lời câu hỏi; công cụ MCP chỉ trả lại một prompt có cấu trúc trong trường answer, rồi client model mới dùng prompt đó để tạo câu trả lời cuối cùng có citation. Đây là thiết kế đáng giá vì nó giữ trách nhiệm ở đúng chỗ. Search/crawl/ranking chịu trách nhiệm đưa bằng chứng, còn model chịu trách nhiệm tổng hợp. Nhiều hệ thống agent lẫn lộn hai lớp này, khiến việc kiểm chứng trở nên mơ hồ.

Về triển khai, TinySearch khá thực dụng. Người dùng có thể chạy qua MCP server cho client như Cursor hay các agent khác, hoặc chạy qua FastAPI nếu cần HTTP. Embedding backend hỗ trợ cả ONNX local lẫn OpenAI-compatible endpoint, cho phép đánh đổi giữa chi phí, quyền riêng tư và chất lượng. Dự án cũng nói rõ giới hạn của mình: không nhằm thay thế commercial search API, không có persistent crawler quy mô lớn và không hứa enterprise observability. Việc ghi rõ giới hạn như vậy làm repo đáng tin hơn.

Với doanh nghiệp hoặc nhóm kỹ thuật nhỏ, TinySearch có giá trị như một lớp web research “vừa đủ”. Nó đặc biệt phù hợp khi đội muốn agent truy cập web theo cách có bằng chứng, nhưng không muốn gánh hẳn một hệ thống indexing lớn. Nếu xu hướng MCP agent tiếp tục tăng, những thành phần trung gian kiểu TinySearch có thể trở thành chuẩn thực dụng cho các workflow nghiên cứu, tổng hợp tin tức hay trả lời câu hỏi cần web grounding.

Điểm nổi bật

Biểu đồ

Tóm tắt

Chi tiết

Nguồn