LLM integration
เลือก model ตามโจทย์ (open-source local · API · hybrid) — สนใจ cost envelope · sovereignty · latency ของลูกค้าเป็นหลัก
ไม่ใช่ chatbot สาธิต — เราทำ generative AI กับ document workflow ของหน่วยงานที่ต้องการความแม่นยำระดับ judicial · RAG · agent · Thai NLP · production-grade
เลือก model ตามโจทย์ (open-source local · API · hybrid) — สนใจ cost envelope · sovereignty · latency ของลูกค้าเป็นหลัก
Vector store · chunking strategy · hybrid retrieval · re-ranker · ตรวจสอบ citation กลับไปยังเอกสารต้นทาง
Workflow ที่ต้องมี human-in-the-loop · audit trail · explainability · ใช้กับ regulated business จริง
Tokenization · NER · sentence segmentation · ภาษาราชการ · ภาษากฎหมาย · ทำกับ Thai-only corpus มานานพอที่จะรู้ pitfall
Foundation model ส่วนใหญ่ฝึกบน English-dominant corpus — ภาษาไทย (โดยเฉพาะภาษาราชการและภาษากฎหมาย) มี edge case ที่ generic model พลาด เช่น compound noun · เลขไทย · proper noun ที่ไม่ขึ้นต้นพิเศษ · code-switching · referent ที่ implicit งานที่ stakes สูง (เช่น judicial drafting หรือ regulatory filing) ไม่ทน hallucination ที่ duck-test ผ่าน แต่ผิดความหมายจริง
เราเข้าใจช่องว่างตรงนี้ และมี process แก้ — ตั้งแต่ data curation · prompt design · evaluation harness ที่มี ground-truth ภาษาไทย · review loop กับ subject-matter expert
ขั้นตอนปกติของเรา: scope workshop → 2–4 week PoC → evaluation gate → production engineering → managed operations · ทุกขั้นมี exit criteria ชัดเจน — ลูกค้าไม่ติดอยู่ใน PoC ที่ไม่จบ