From 2033c175ac4a07bed6bb2f397b9dd3ac9b0a3c1a Mon Sep 17 00:00:00 2001 From: Musab Erdem Date: Tue, 4 Nov 2025 20:59:06 +0100 Subject: [PATCH] README.md aktualisiert --- README.md | 50 +++++++++++++++++++++++++++++++++++++++++++------- 1 file changed, 43 insertions(+), 7 deletions(-) diff --git a/README.md b/README.md index 0541474..9bcf65d 100644 --- a/README.md +++ b/README.md @@ -62,7 +62,8 @@ Das Programm funktioniert mit jedem OpenAI-kompatiblen Endpunkt: python meeting_summarizer.py meeting.mp3 \ --api-base http://localhost:11434/v1 \ --api-key ollama \ - --model llama3.2 + --model llama3.2 \ + --language german ``` #### LM Studio (lokal) @@ -70,7 +71,8 @@ python meeting_summarizer.py meeting.mp3 \ python meeting_summarizer.py meeting.mp3 \ --api-base http://localhost:1234/v1 \ --api-key lm-studio \ - --model local-model + --model local-model \ + --language english ``` #### Anthropic Claude (via OpenAI-Kompatibilitätslayer) @@ -78,7 +80,8 @@ python meeting_summarizer.py meeting.mp3 \ python meeting_summarizer.py meeting.mp3 \ --api-base https://api.anthropic.com/v1 \ --api-key $ANTHROPIC_API_KEY \ - --model claude-3-5-sonnet-20241022 + --model claude-3-5-sonnet-20241022 \ + --language german ``` #### OpenRouter @@ -86,7 +89,8 @@ python meeting_summarizer.py meeting.mp3 \ python meeting_summarizer.py meeting.mp3 \ --api-base https://openrouter.ai/api/v1 \ --api-key $OPENROUTER_API_KEY \ - --model anthropic/claude-3.5-sonnet + --model anthropic/claude-3.5-sonnet \ + --language spanish ``` ## Verwendung @@ -107,6 +111,7 @@ Dies erstellt: python meeting_summarizer.py meeting.wav \ --whisper-model medium \ --model gpt-4 \ + --language german \ --output-dir ./summaries \ --api-base https://api.openai.com/v1 ``` @@ -127,6 +132,9 @@ Optionen: --model MODEL LLM-Modellname (default: gpt-4) + --language LANG Sprache für die Zusammenfassung (default: english) + Beispiele: english, german, spanish, french, turkish + --output-dir DIR Ausgabeverzeichnis für Transkript und Zusammenfassung (default: gleiches Verzeichnis wie Audio-Datei) @@ -158,6 +166,32 @@ Alle Formate, die von ffmpeg unterstützt werden: - WMA - AAC +## Sprach-Handling + +Das Programm unterscheidet zwischen zwei Spracheinstellungen: + +### Transkription (Input) +- **Whisper erkennt die Sprache automatisch** - du musst nichts einstellen +- Die Audio-Datei kann in jeder Sprache sein (Deutsch, Englisch, Spanisch, etc.) +- Whisper transkribiert das Audio in der Originalsprache + +### Zusammenfassung (Output) +- **Der `--language` Parameter steuert die Ausgabesprache** der Zusammenfassung +- Du kannst z.B. ein deutsches Meeting transkribieren und eine englische Zusammenfassung erhalten +- Alle Prompts an das LLM sind auf Englisch, aber das LLM antwortet in der gewünschten Sprache + +**Beispiel:** +```bash +# Deutsches Meeting → Deutsche Zusammenfassung +python meeting_summarizer.py german-meeting.mp3 --language german + +# Deutsches Meeting → Englische Zusammenfassung +python meeting_summarizer.py german-meeting.mp3 --language english + +# Türkisches Meeting → Türkische Zusammenfassung +python meeting_summarizer.py turkish-meeting.mp3 --language turkish +``` + ## Programmatische Verwendung Du kannst das Programm auch als Modul verwenden: @@ -170,7 +204,8 @@ summarizer = MeetingSummarizer( whisper_model="base", api_base_url="http://localhost:11434/v1", api_key="ollama", - model_name="llama3.2" + model_name="llama3.2", + output_language="german" ) # Verarbeite ein Meeting @@ -193,7 +228,8 @@ print(summary) ### Für bessere Qualität: - Nutze größere Whisper-Modelle (`medium` oder `large`) - Stelle sicher, dass die Audio-Qualität gut ist -- Bei mehrsprachigen Meetings: Entferne `language="de"` im Code für Auto-Detection +- Whisper erkennt die Sprache des Audios automatisch +- Mit `--language` bestimmst du die Sprache der **Zusammenfassung**, nicht der Transkription ## Tipps für embedded Systems @@ -229,4 +265,4 @@ Frei verwendbar für private und kommerzielle Zwecke. - Whisper läuft komplett lokal - keine Audio-Daten werden gesendet - Nur der transkribierte Text wird an das LLM gesendet - Achte auf Datenschutz bei sensiblen Meeting-Inhalten -- Die Qualität der Zusammenfassung hängt vom gewählten LLM ab +- Die Qualität der Zusammenfassung hängt vom gewählten LLM ab \ No newline at end of file