Skip to content

valav-lem/vazhi

 
 

Repository files navigation

VAZHI (வழி) — AI Vazhi Thozhan (AI வழித் தோழன்)

The Friend on Your AI Journey | உங்கள் AI பயணத்தின் தோழன்

Your Offline AI Companion for Tamil Nadu — எப்போதும் உங்களுடன், இணையம் இல்லாமலும்


The Problem We're Solving | நாங்கள் தீர்க்கும் பிரச்சனை

Every day in Tamil Nadu, hardworking people fall victim to scams, miss out on government benefits they're entitled to, or struggle to find reliable information — simply because:

  • No reliable internet in many rural areas
  • Lack of awareness about digital threats and opportunities
  • Language barrier — most AI tools are English-first
  • Trust issues — online services track, sell data, or upsell
  • Complexity — navigating government websites is overwhelming

Real stories we want to prevent:

"என் அப்பா ₹50,000 இழந்தார் — 'நீங்கள் லாட்டரி வென்றீர்கள்' என்ற SMS நம்பி" My father lost ₹50,000 believing an SMS that said he won a lottery

"PM-KISAN scheme-க்கு eligible-ஆ இருந்தேன், ஆனா எனக்கு தெரியவே இல்ல" I was eligible for PM-KISAN scheme but didn't even know about it


What is VAZHI? | வழி என்றால் என்ன?

VAZHI is a free, offline AI assistant that lives on your phone — no internet required, no fees ever, no tracking.

Think of it as a knowledgeable friend (தோழன்) who:

  • Warns you about scams before you lose money
  • Explains government schemes you qualify for
  • Answers health questions in Tamil
  • Shares Tamil culture and wisdom
  • Never judges, never sells your data, always available

How It Works | எப்படி வேலை செய்கிறது

📱 Download the app (one time) ↓ 📦 Choose knowledge packs you need (Scam Protection, Govt Schemes, Health, etc.) ↓ ✈️ Use anywhere — on a bus, in a village, with no internet ↓ 💬 Ask anything in Tamil — get helpful answers instantly 

Real-World Use Cases | நிஜ வாழ்க்கை உதாரணங்கள்

🛡️ Scam Protection | மோசடி பாதுகாப்பு

Scenario: You receive an SMS saying "Congratulations! You've won ₹10,00,000 in Jio Lucky Draw. Send ₹500 processing fee to claim."

Ask VAZHI:

"இந்த message உண்மையா? Jio lucky draw-ல ₹10 லட்சம் வென்றதா சொல்கிறார்கள்"

VAZHI responds:

"⚠️ இது மோசடி! உண்மையான லாட்டரிகள் பணம் கேட்காது. Jio இப்படி SMS அனுப்புவதில்லை. இந்த number-ஐ block செய்யுங்கள். எந்த OTP-யும் share செய்யாதீர்கள்."

Other scams VAZHI helps detect:

  • Fake bank calls asking for OTP
  • "Your ATM card is blocked" phishing
  • Fake job offers requiring registration fees
  • Fraudulent insurance claims
  • Impersonation scams ("I'm calling from SBI")

🏛️ Government Schemes | அரசு திட்டங்கள்

Scenario: A farmer wants to know what schemes he qualifies for.

Ask VAZHI:

"நான் ஒரு விவசாயி. எனக்கு என்ன அரசு திட்டங்கள் கிடைக்கும்?"

VAZHI responds:

"விவசாயிகளுக்கான முக்கிய திட்டங்கள்:

  1. PM-KISAN: ஆண்டுக்கு ₹6,000 (₹2,000 x 3 தவணை)
  2. Crop Insurance: பயிர் காப்பீடு
  3. Kisan Credit Card: குறைந்த வட்டி கடன்

விண்ணப்பிக்க: உங்கள் அருகிலுள்ள e-Sevai மையம் செல்லுங்கள். Aadhaar, நில ஆவணங்கள் எடுத்துச் செல்லுங்கள்."

🏥 Health Information | சுகாதார தகவல்கள்

Scenario: Someone wants to know about free health schemes.

Ask VAZHI:

"அரசு மருத்துவமனையில் free treatment கிடைக்குமா?"

VAZHI responds:

"ஆம்! CMCHIS (முதலமைச்சர் மாவட்ட சுகாதார காப்பீட்டு திட்டம்) மூலம் ₹5 லட்சம் வரை இலவச சிகிச்சை கிடைக்கும்.

தேவையானவை: Aadhaar card, ration card. எங்கே: அரசு மருத்துவமனை CMCHIS counter."

🪷 Tamil Culture & Wisdom | தமிழ் பண்பாடு

Scenario: A student wants to learn about Thirukkural.

Ask VAZHI:

"திருக்குறளின் முதல் குறள் என்ன?"

VAZHI responds:

"அகர முதல எழுத்தெல்லாம் ஆதி பகவன் முதற்றே உலகு

பொருள்: எல்லா எழுத்துக்களுக்கும் 'அ' முதல் எழுத்து. அதுபோல், உலகிற்கு இறைவன் முதல்வன்.

— திருவள்ளுவர், அறத்துப்பால், கடவுள் வாழ்த்து"


Why Offline? | ஏன் ஆஃப்லைன்?

Online AI Problems VAZHI Solution
Needs internet Works without internet
Monthly fees Free forever
Tracks your data Zero tracking
Sells your info Your data stays on YOUR phone
English-first Tamil-first
Complex to use Simple chat interface
May give wrong info Verified, curated knowledge

Your conversations never leave your phone. No server. No cloud. No tracking. Ever.


Knowledge Packs | அறிவுத் தொகுப்புகள்

Download only what you need. Each pack is carefully curated with verified information.

Pack தமிழ் பெயர் What's Inside
🛡️ Security காவல் Scam detection, cyber safety, OTP safety, women's safety
🏛️ Government அரசு PM-KISAN, ration card, Aadhaar, e-Sevai, pensions
🏥 Healthcare மருத்துவம் CMCHIS, Siddha medicine, first aid, mental health
📚 Education கல்வி Scholarships, admissions, competitive exams, career guidance
⚖️ Legal சட்டம் Tenant rights, RTI, consumer protection, legal aid
🪷 Culture பண்பாடு Thirukkural, Siddhars, temples, festivals, Tamil literature

Coming soon: Agriculture (வேளாண்மை), Women & Child (பெண்கள் & குழந்தைகள்), Senior Citizens (மூத்த குடிமக்கள்)


Core Principles | அடிப்படை கொள்கைகள்

Principle Meaning தமிழில்
வழி காட்டும் Shows the way வழிகாட்டுகிறது
Zero-cost Free forever, no hidden fees எப்போதும் இலவசம்
Offline-first Works without internet இணையம் தேவையில்லை
Tamil-first Built natively for Tamil தமிழுக்காக உருவாக்கப்பட்டது
Privacy-first No tracking, no data collection தனியுரிமை பாதுகாப்பு
Open source Transparent, community-owned அனைவருக்கும் திறந்தது

Current Status | தற்போதைய நிலை

Version: v0.8 (Hybrid Architecture)

Key Innovation: Hybrid Retrieval

VAZHI now uses a Hybrid Retrieval Architecture that works immediately after installation:

Feature Without Model With Model
Thirukkural lookup Instant Instant + AI explanation
Emergency numbers Instant Instant
Scheme details Instant Instant + advice
Scam detection Basic patterns Full AI analysis
Conversations Limited Full capability

Technical Details

Component Status
Hybrid Architecture Deterministic SQLite + Optional AI
AI Model (Target) Qwen3-0.6B (<1GB GGUF)
Training Approach Two-stage: Micro-DAPT → SFT
Deterministic Data ~2,500 records (~2MB)
Mobile App Flutter + Riverpod

Progress

  • Training data: 13,078 Tamil Q&A pairs
  • Knowledge packs: 6 domains created
  • Mobile app: Full UI with hybrid support
  • Hybrid architecture: Query Router + Retrieval Services
  • Deterministic retrieval: Thirukkural, Schemes, Emergency, Health
  • Model download: Pause/resume, network detection, storage validation
  • Voice input/output: Tamil STT/TTS
  • Feedback system: In-app with WhatsApp integration
  • Security hardening: Encrypted storage, input validation
  • Code quality: 228 tests passing, 19 issues closed
  • AI model training: Qwen3-0.6B (v0.8) in progress on Kaggle
  • Full database population: Pending
  • App store release: Planned

Security & Privacy Features

VAZHI takes user privacy seriously. The app includes multiple layers of protection:

Feature Description
Encrypted Storage User feedback encrypted with AES cipher (flutter_secure_storage)
Input Validation SQL/FTS5 injection prevention, query sanitization
ReDoS Protection Regular expression denial-of-service detection
Secure Downloads URL allowlist + SHA256 checksum verification
Zero Tracking No analytics, no telemetry, no cloud sync
Offline-First All data stays on device, no server required

Accessibility

  • Screen reader support (Semantics widgets)
  • Voice input/output (Tamil STT/TTS)
  • High contrast UI options
  • Large text support

Get Involved | பங்களியுங்கள்

VAZHI is built by the community, for the community. We need your help!

Ways to Contribute | பங்களிக்க வழிகள்

Role What You'll Do Skills Needed
Data Contributor Create Tamil Q&A pairs for knowledge packs Tamil fluency, domain knowledge
Developer Build app features, model training Python, Flutter, ML
Tester Try the app, report bugs, suggest improvements Smartphone, patience
Translator Help with Tamil documentation Tamil & English
Domain Expert Verify accuracy of health/legal/govt info Professional expertise
Outreach Spread the word in your community Passion for the cause

Sponsor a Developer | டெவலப்பரை ஸ்பான்சர் செய்யுங்கள்

We want to support young freshers from Tamil Nadu who want to become AI developers.

₹25,000/month sponsors one young developer to work full-time on VAZHI.

Your sponsorship helps:

  • Fresh graduates learn AI/ML skills
  • Build something meaningful for their community
  • Create employment in Tamil Nadu's tech ecosystem

Sponsorship program launching soon. Contact us to be notified.

Join the Community | சமூகத்தில் சேருங்கள்

  • WhatsApp Group: Coming soon
  • GitHub: github.com/vazhi — Star the repo!
  • Email: [To be added]

Why "VAZHI"? | ஏன் "வழி"?

வழி (vazhi) means "path" or "way" in Tamil.

  • It shows the way — guiding you through complex information
  • It's an open path — anyone can use it, contribute to it
  • It's your path — no corporation controls it, the community owns it

Full form: Voluntary AI with Zero-cost Helpful Intelligence

Tagline: AI Vazhi Thozhan (AI வழித் தோழன்) — The Friend on Your AI Journey


தமிழில் | In Tamil

வழி என்றால் என்ன?

வழி என்பது ஒரு இலவச, ஆஃப்லைன் AI உதவியாளர். இது உங்கள் மொபைலிலேயே இயங்கும் — இணையம் தேவையில்லை, கட்டணம் இல்லை, உங்கள் தகவல்கள் யாருக்கும் போகாது.

யாருக்கு உதவும்?

  • மோசடிகளிலிருந்து பாதுகாக்க விரும்புவோர்
  • அரசு திட்டங்களை அறிய விரும்புவோர்
  • சுகாதார தகவல்கள் தேவைப்படுவோர்
  • தமிழ் பண்பாடு பற்றி அறிய விரும்புவோர்

எப்படி உபயோகிப்பது?

  1. App-ஐ download செய்யுங்கள் (ஒரு முறை மட்டும்)
  2. தேவையான knowledge packs-ஐ தேர்வு செய்யுங்கள்
  3. இணையம் இல்லாமலேயே எங்கு வேண்டுமானாலும் பயன்படுத்துங்கள்
  4. தமிழில் கேளுங்கள் — உடனடி பதில் பெறுங்கள்

ஏன் வழி சிறந்தது?

மற்ற AI வழி
இணையம் வேண்டும் ஆஃப்லைன்
கட்டணம் இலவசம்
ஆங்கிலம் தமிழ்
உங்கள் data-ஐ track செய்யும் எந்த tracking-ம் இல்லை
பெரிய நிறுவனங்கள் சமூகம்

பங்களிக்க விரும்புகிறீர்களா?

  • தமிழ் Q&A உருவாக்குங்கள்
  • App-ஐ test செய்யுங்கள்
  • உங்கள் கிராமத்தில் பரப்புங்கள்
  • ஒரு young developer-ஐ sponsor செய்யுங்கள் (₹25,000/மாதம்)

உங்கள் பங்களிப்பு ஒரு குடும்பத்தை மோசடியிலிருந்து காப்பாற்றலாம்!


Technical Details | தொழில்நுட்ப விவரங்கள்

For developers and contributors:

Architecture

┌─────────────────────────────────────────────────────────────┐ │ VAZHI Mobile App │ ├─────────────────────────────────────────────────────────────┤ │ ┌─────────────┐ ┌────────────────┐ ┌──────────────┐ │ │ │ Chat UI │ │ Knowledge Pack │ │ Voice │ │ │ │ (Tamil) │ │ Selector │ │ STT/TTS │ │ │ └──────┬──────┘ └───────┬────────┘ └──────────────┘ │ │ │ │ │ │ ▼ ▼ │ │ ┌─────────────────────────────────────┐ │ │ │ Query Router │◄── Pattern matching │ │ └──────────────┬──────────────────────┘ │ │ │ │ │ ┌─────────┴─────────┐ │ │ ▼ ▼ │ │ ┌──────────┐ ┌──────────────┐ │ │ │ SQLite │ │ LLM Engine │ ◄── Optional download │ │ │ (2MB) │ │ (<1GB GGUF) │ │ │ └────┬─────┘ └──────┬───────┘ │ │ │ │ │ │ └────────┬───────────┘ │ │ ▼ │ │ ┌─────────────────────────────────────┐ │ │ │ Hybrid Response (Data + AI) │ │ │ └─────────────────────────────────────┘ │ └─────────────────────────────────────────────────────────────┘ Works immediately • AI enhancement optional 

Repository Structure

vazhi/ ├── data/ # Training datasets ├── models/ # Model training logs ├── notebooks/ # Training notebooks (Colab/Kaggle) ├── schemas/ # JSON schemas for validation ├── scripts/ # Data processing scripts │ ├── preflight_validation.py # Pre-training checks │ ├── rebalance_training_data.py # Dataset balancer │ └── validate_training_data.py # Schema validation ├── vazhi_app/ # Flutter mobile app │ ├── lib/ │ │ ├── database/migrations/ # DB migration framework │ │ ├── l10n/ # i18n ARB files (en/ta) │ │ ├── services/ # Query router, API, voice │ │ └── widgets/ # Accessible UI components │ └── test/ # 228 tests ├── huggingface-space/ # Test API └── docs/ # Documentation ├── LESSONS_LEARNED.md # What we learned ├── SPRINT_PLAN_REVISED.md # Current roadmap └── TRAINING_LOG.md # Training history 

Training Data

Source Items Content
VAZHI Knowledge Packs 11,112 Domain-specific Tamil Q&A
IndicAlign Anudesh (Tamil) 1,966 Native Tamil instructions
Total 13,078 High-quality Tamil training data

License | உரிமம்

Apache 2.0 License — Free to use, modify, and distribute.

This is a community project. No corporation owns it. You own it.


Acknowledgments | நன்றி

  • Sarvam AI — For Tamil-optimized base models
  • AI4Bharat — For IndicAlign dataset
  • Hugging Face — For model hosting and tools
  • The Tamil open-source community — For inspiration and support
  • Every contributor — This is YOUR project

வழி காட்டும் AI — AI வழித் தோழன்
The Friend on Your AI Journey

🌾 For every farmer who deserves to know their rights
👵 For every grandmother who shouldn't fall for scams
📚 For every student who wants to learn in Tamil
🏠 For every family that deserves free, private AI

Built by the community. For the community. Forever free.


Last updated: February 10, 2026

About

VAZHI (வழி) - Voluntary AI with Zero-cost Helpful Intelligence. The open path to Tamil AI.

Resources

Contributing

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages

  • Jupyter Notebook 88.6%
  • Dart 6.8%
  • Python 4.6%
  • Swift 0.0%
  • Ruby 0.0%
  • HTML 0.0%