Repository ini adalah komponen penyiapan data intent untuk proyek SentinelAI — AI Emergency Assistant. Fokusnya bukan chatbot end-to-end, tetapi menghasilkan dataset training yang dipakai pada tahap Intent Classification (NLP Model) di alur:
flowchart LR A[User Input] --> B[Text Preprocessing] B --> C[Intent Classification] C --> D[Intent Mapping] D --> E[Response Generator] Dataset yang dihasilkan berisi pasangan
textdanintentuntuk skenario tanggap bencana.
Intent awal (MVP) yang tersedia saat ini:
earthquake_helpflood_helpfire_helpevacuation_locationfirst_aidgeneral_chit_chat
src/data/taxonomy.py: sumber utterance per intentsrc/data/generator.py: mengubah taxonomy menjadi dataset flatsrc/data/cli.py: antarmuka CLI untuk generate datasetmain.py: entry point eksekusi proyek
python main.py --outdir ./datasets --filename final_dataset.jsonGenerator membuat file JSON berformat list objek:
[ {"text": "ada gempa bumi besar", "intent": "earthquake_help"}, {"text": "tolong rumah kebanjiran", "intent": "flood_help"} ]- Direktori output akan dibuat otomatis jika belum ada.
- Menambah data intent dilakukan dari
src/data/taxonomy.py, lalu generate ulang file JSON.
Proyek ini menggunakan lisensi MIT. Lihat file LICENSE untuk detail lengkap.