README.md aktualisiert

This commit is contained in:
2025-11-04 20:59:06 +01:00
parent 45c9601608
commit 2033c175ac

View File

@@ -62,7 +62,8 @@ Das Programm funktioniert mit jedem OpenAI-kompatiblen Endpunkt:
python meeting_summarizer.py meeting.mp3 \
--api-base http://localhost:11434/v1 \
--api-key ollama \
--model llama3.2
--model llama3.2 \
--language german
```
#### LM Studio (lokal)
@@ -70,7 +71,8 @@ python meeting_summarizer.py meeting.mp3 \
python meeting_summarizer.py meeting.mp3 \
--api-base http://localhost:1234/v1 \
--api-key lm-studio \
--model local-model
--model local-model \
--language english
```
#### Anthropic Claude (via OpenAI-Kompatibilitätslayer)
@@ -78,7 +80,8 @@ python meeting_summarizer.py meeting.mp3 \
python meeting_summarizer.py meeting.mp3 \
--api-base https://api.anthropic.com/v1 \
--api-key $ANTHROPIC_API_KEY \
--model claude-3-5-sonnet-20241022
--model claude-3-5-sonnet-20241022 \
--language german
```
#### OpenRouter
@@ -86,7 +89,8 @@ python meeting_summarizer.py meeting.mp3 \
python meeting_summarizer.py meeting.mp3 \
--api-base https://openrouter.ai/api/v1 \
--api-key $OPENROUTER_API_KEY \
--model anthropic/claude-3.5-sonnet
--model anthropic/claude-3.5-sonnet \
--language spanish
```
## Verwendung
@@ -107,6 +111,7 @@ Dies erstellt:
python meeting_summarizer.py meeting.wav \
--whisper-model medium \
--model gpt-4 \
--language german \
--output-dir ./summaries \
--api-base https://api.openai.com/v1
```
@@ -127,6 +132,9 @@ Optionen:
--model MODEL LLM-Modellname (default: gpt-4)
--language LANG Sprache für die Zusammenfassung (default: english)
Beispiele: english, german, spanish, french, turkish
--output-dir DIR Ausgabeverzeichnis für Transkript und Zusammenfassung
(default: gleiches Verzeichnis wie Audio-Datei)
@@ -158,6 +166,32 @@ Alle Formate, die von ffmpeg unterstützt werden:
- WMA
- AAC
## Sprach-Handling
Das Programm unterscheidet zwischen zwei Spracheinstellungen:
### Transkription (Input)
- **Whisper erkennt die Sprache automatisch** - du musst nichts einstellen
- Die Audio-Datei kann in jeder Sprache sein (Deutsch, Englisch, Spanisch, etc.)
- Whisper transkribiert das Audio in der Originalsprache
### Zusammenfassung (Output)
- **Der `--language` Parameter steuert die Ausgabesprache** der Zusammenfassung
- Du kannst z.B. ein deutsches Meeting transkribieren und eine englische Zusammenfassung erhalten
- Alle Prompts an das LLM sind auf Englisch, aber das LLM antwortet in der gewünschten Sprache
**Beispiel:**
```bash
# Deutsches Meeting → Deutsche Zusammenfassung
python meeting_summarizer.py german-meeting.mp3 --language german
# Deutsches Meeting → Englische Zusammenfassung
python meeting_summarizer.py german-meeting.mp3 --language english
# Türkisches Meeting → Türkische Zusammenfassung
python meeting_summarizer.py turkish-meeting.mp3 --language turkish
```
## Programmatische Verwendung
Du kannst das Programm auch als Modul verwenden:
@@ -170,7 +204,8 @@ summarizer = MeetingSummarizer(
whisper_model="base",
api_base_url="http://localhost:11434/v1",
api_key="ollama",
model_name="llama3.2"
model_name="llama3.2",
output_language="german"
)
# Verarbeite ein Meeting
@@ -193,7 +228,8 @@ print(summary)
### Für bessere Qualität:
- Nutze größere Whisper-Modelle (`medium` oder `large`)
- Stelle sicher, dass die Audio-Qualität gut ist
- Bei mehrsprachigen Meetings: Entferne `language="de"` im Code für Auto-Detection
- Whisper erkennt die Sprache des Audios automatisch
- Mit `--language` bestimmst du die Sprache der **Zusammenfassung**, nicht der Transkription
## Tipps für embedded Systems