Mini Project Category

Artificial Intelligence

VoiceNotes

Completed

Speech-to-notes conversion using Whisper and LLM processing for structured output.

Date

2024-03

Duration

3 weeks

Team

solo

Difficulty

medium

VoiceNotes captures spoken ideas and converts them into structured Markdown notes. It is focused on turning rough thoughts into usable documentation.

The pipeline uses Whisper for transcription and an LLM for post-processing into concise summaries, action items, and clean Markdown.

PythonOpenAI WhisperLLM ProcessingMarkdownAudio Processing

Speech-to-markdown conversion

Automatic summarization

Action item extraction

Timestamped notes

Batch processing support

Audio quality variance

Multi-speaker handling

Long transcript context limits

Latency for larger files

Audio quality has first-order impact on results

Post-processing quality determines practical usefulness

Context chunking strategy matters for long sessions

Feedback loops improve output accuracy

Resume helper focused on showcasing AI skills

Outfit assistant using image generation models. Uses MacBook Air M1 instead of GPU.

RAG application using vector embeddings with OpenAI embeddings and FAISS for search

If you want to build a practical AI feature like this in your product, reach out and I can help with architecture, prototyping, and delivery.