IMPLEMENTASI SISTEM RETRIEVAL-AUGMENTED GENERATION (RAG)

STUDI KASUS: QUESTION ANSWERING DARI DOKUMEN PDF

Authors

  • Apbenk Fathur Rahman Universitas Negeri Padang
  • Dony Novaliendry Universitas Negeri Padang
  • Yeka Hendriyani Universitas Negeri Padang
  • Khairi Budayawan Universitas Negeri Padang

Keywords:

Dokumen digital (PDF), Question Answering, Retrieval-Augmented Generation (RAG), Large Language Model (LLM).

Abstract

Peningkatan kebutuhan akan sistem pengelolaan dan analisis informasi semakin nyata seiring dengan pertumbuhan data digital yang pesat. Dokumen digital seperti PDF menimbulkan tantangan dalam memperoleh informasi spesifik secara cepat dan akurat akibat sifatnya yang statis serta ketergantungan pada pencarian manual. Penelitian ini bertujuan untuk mengembangkan sistem question answering berbasis Retrieval-Augmented Generation (RAG) yang mampu mengekstraksi dan menghasilkan jawaban secara langsung dari dokumen PDF. Sistem diimplementasikan sebagai aplikasi web berbasis framework Flask dan dikembangkan menggunakan metode Waterfall yang meliputi tahapan analisis kebutuhan, perancangan sistem, implementasi, pengujian, dan pemeliharaan. Pipeline RAG mengintegrasikan proses segmentasi dokumen, pembentukan semantic embedding, serta pengindeksan berbasis vektor untuk mendukung pencarian berdasarkan kesamaan makna, yang kemudian dipadukan dengan Large Language Model (LLM) dalam proses generasi jawaban. Hasil penelitian menunjukkan bahwa sistem mampu menghasilkan jawaban yang relevan dan akurat sesuai dengan isi dokumen sumber, meningkatkan efisiensi pencarian informasi, serta meminimalkan risiko terjadinya halusinasi informasi. Selain itu, penerapan manajemen sesi dan mekanisme password hashing memastikan keamanan serta kerahasiaan dokumen pengguna.

Downloads

Published

2026-01-31

How to Cite

Rahman, A. F., Novaliendry , D., Hendriyani , Y., & Budayawan, K. (2026). IMPLEMENTASI SISTEM RETRIEVAL-AUGMENTED GENERATION (RAG) : STUDI KASUS: QUESTION ANSWERING DARI DOKUMEN PDF. Scientica: Jurnal Ilmiah Sains Dan Teknologi, 4(1), 246–259. Retrieved from https://jurnal.kolibi.id/index.php/scientica/article/view/272