README.md aktualisiert

2025-11-04 20:59:06 +01:00
parent 45c9601608
commit 2033c175ac
1 changed files with 43 additions and 7 deletions
@@ -62,7 +62,8 @@ Das Programm funktioniert mit jedem OpenAI-kompatiblen Endpunkt:
 python meeting_summarizer.py meeting.mp3 \
  --api-base http://localhost:11434/v1 \
  --api-key ollama \
-  --model llama3.2
+  --model llama3.2 \
+  --language german
 ```

 #### LM Studio (lokal)
@@ -70,7 +71,8 @@ python meeting_summarizer.py meeting.mp3 \
 python meeting_summarizer.py meeting.mp3 \
  --api-base http://localhost:1234/v1 \
  --api-key lm-studio \
-  --model local-model
+  --model local-model \
+  --language english
 ```

 #### Anthropic Claude (via OpenAI-Kompatibilitätslayer)
@@ -78,7 +80,8 @@ python meeting_summarizer.py meeting.mp3 \
 python meeting_summarizer.py meeting.mp3 \
  --api-base https://api.anthropic.com/v1 \
  --api-key $ANTHROPIC_API_KEY \
-  --model claude-3-5-sonnet-20241022
+  --model claude-3-5-sonnet-20241022 \
+  --language german
 ```

 #### OpenRouter
@@ -86,7 +89,8 @@ python meeting_summarizer.py meeting.mp3 \
 python meeting_summarizer.py meeting.mp3 \
  --api-base https://openrouter.ai/api/v1 \
  --api-key $OPENROUTER_API_KEY \
-  --model anthropic/claude-3.5-sonnet
+  --model anthropic/claude-3.5-sonnet \
+  --language spanish
 ```

 ## Verwendung
@@ -107,6 +111,7 @@ Dies erstellt:
 python meeting_summarizer.py meeting.wav \
  --whisper-model medium \
  --model gpt-4 \
+  --language german \
  --output-dir ./summaries \
  --api-base https://api.openai.com/v1
 ```
@@ -127,6 +132,9 @@ Optionen:
  
  --model MODEL          LLM-Modellname (default: gpt-4)
  
+  --language LANG        Sprache für die Zusammenfassung (default: english)
+                         Beispiele: english, german, spanish, french, turkish
+                         
  --output-dir DIR       Ausgabeverzeichnis für Transkript und Zusammenfassung
                         (default: gleiches Verzeichnis wie Audio-Datei)
                         
@@ -158,6 +166,32 @@ Alle Formate, die von ffmpeg unterstützt werden:
 - WMA
 - AAC

+## Sprach-Handling
+
+Das Programm unterscheidet zwischen zwei Spracheinstellungen:
+
+### Transkription (Input)
+- **Whisper erkennt die Sprache automatisch** - du musst nichts einstellen
+- Die Audio-Datei kann in jeder Sprache sein (Deutsch, Englisch, Spanisch, etc.)
+- Whisper transkribiert das Audio in der Originalsprache
+
+### Zusammenfassung (Output)
+- **Der `--language` Parameter steuert die Ausgabesprache** der Zusammenfassung
+- Du kannst z.B. ein deutsches Meeting transkribieren und eine englische Zusammenfassung erhalten
+- Alle Prompts an das LLM sind auf Englisch, aber das LLM antwortet in der gewünschten Sprache
+
+**Beispiel:**
+```bash
+# Deutsches Meeting → Deutsche Zusammenfassung
+python meeting_summarizer.py german-meeting.mp3 --language german
+
+# Deutsches Meeting → Englische Zusammenfassung
+python meeting_summarizer.py german-meeting.mp3 --language english
+
+# Türkisches Meeting → Türkische Zusammenfassung
+python meeting_summarizer.py turkish-meeting.mp3 --language turkish
+```
+
 ## Programmatische Verwendung

 Du kannst das Programm auch als Modul verwenden:
@@ -170,7 +204,8 @@ summarizer = MeetingSummarizer(
    whisper_model="base",
    api_base_url="http://localhost:11434/v1",
    api_key="ollama",
-    model_name="llama3.2"
+    model_name="llama3.2",
+    output_language="german"
 )

 # Verarbeite ein Meeting
@@ -193,7 +228,8 @@ print(summary)
 ### Für bessere Qualität:
 - Nutze größere Whisper-Modelle (`medium` oder `large`)
 - Stelle sicher, dass die Audio-Qualität gut ist
- Bei mehrsprachigen Meetings: Entferne `language="de"` im Code für Auto-Detection
+- Whisper erkennt die Sprache des Audios automatisch
+- Mit `--language` bestimmst du die Sprache der **Zusammenfassung**, nicht der Transkription

 ## Tipps für embedded Systems