AI คุยกับเว็บไซต์ของฉันแบบส่วนตัว (Local RAG) คืออะไร?
หลายครั้งคุณแค่อยากถามเว็บไซต์หนึ่งอย่างรวดเร็ว เช่น หน้าคู่มือ, หน้าราคา, ศูนย์ช่วยเหลือ หรือหน้านโยบาย การคัดลอกข้อความทีละหน้ามาใส่ chatbot นั้นช้าและซ้ำซาก ส่วนการใช้ crawler แบบ hosted สำหรับงานเบา ๆ แบบนี้ก็มักเกินความจำเป็น
เครื่องมือนี้เก็บขั้นตอนนั้นไว้ในเบราว์เซอร์ เบราว์เซอร์จะดึงหน้าที่เข้าถึงได้โดยตรง แยกข้อความที่อ่านง่าย แบ่งเป็นช่วงด้วย LangChain สร้างดัชนีแบบโลคัล เก็บไว้ใน IndexedDB แล้วสร้างคำตอบบนอุปกรณ์จากข้อความที่ค้นคืนได้ โดยไม่ต้องเก็บเนื้อหาของหน้าไว้บนเซิร์ฟเวอร์ของแอป
การถามตอบกับเว็บไซต์มีประโยชน์ แต่การ crawl แบบ hosted มักหนักเกินไป
คำถามเกี่ยวกับเว็บไซต์จำนวนมากค่อนข้างเฉพาะ เช่น docs พูดถึงลิมิตอะไร หน้าราคามีเงื่อนไขคืนเงินไหม หรือ policy เขียนเรื่อง retention อย่างไร
การคัดลอกด้วยมือเป็นงานที่ซ้ำ และเมื่อกลับมาดูเว็บไซต์เดิมอีกครั้งก็ต้องทำใหม่
ในขณะเดียวกัน ไม่ใช่ทุก workflow จะต้องใช้ crawler ระยะไกลหรือระบบสร้างดัชนีแบบ hosted
หากเป้าหมายคือการถามเว็บไซต์แบบ private บนอุปกรณ์เดียว พร้อมตรวจดู URL ต้นทางได้ local website RAG จะเหมาะมาก
fetch ในเบราว์เซอร์, แบ่ง chunk แบบโลคัล, ค้นด้วย Voyager แบบโลคัล, ตอบแบบโลคัล
เครื่องมือนี้เริ่มจาก URL ดึงหน้าหลักและอาจตามลิงก์ origin เดียวกันเพิ่มอีกเล็กน้อย จากนั้นแปลงเนื้อหาให้อยู่ในรูปของ chunk ที่ค้นคืนได้
chunk, embedding และดัชนี Voyager ที่ serialize แล้วจะถูกเก็บใน IndexedDB เพื่อเปิดใช้ซ้ำบนอุปกรณ์เดิมได้ภายหลัง
เมื่อคุณถามคำถาม เบราว์เซอร์จะดึง chunk ของเว็บไซต์ที่เกี่ยวข้องที่สุดจาก local vector store แล้วส่งต่อให้ขั้นตอนสร้างคำตอบบนอุปกรณ์