Compare commits
3 Commits
95fb5c7020
...
main
| Author | SHA1 | Date | |
|---|---|---|---|
| 2033c175ac | |||
| 45c9601608 | |||
| 7b46066054 |
3
.gitignore
vendored
3
.gitignore
vendored
@@ -1,3 +1,4 @@
|
||||
venv
|
||||
*.mp3
|
||||
*.txt
|
||||
*summary.txt
|
||||
*transcript.txt
|
||||
48
README.md
48
README.md
@@ -62,7 +62,8 @@ Das Programm funktioniert mit jedem OpenAI-kompatiblen Endpunkt:
|
||||
python meeting_summarizer.py meeting.mp3 \
|
||||
--api-base http://localhost:11434/v1 \
|
||||
--api-key ollama \
|
||||
--model llama3.2
|
||||
--model llama3.2 \
|
||||
--language german
|
||||
```
|
||||
|
||||
#### LM Studio (lokal)
|
||||
@@ -70,7 +71,8 @@ python meeting_summarizer.py meeting.mp3 \
|
||||
python meeting_summarizer.py meeting.mp3 \
|
||||
--api-base http://localhost:1234/v1 \
|
||||
--api-key lm-studio \
|
||||
--model local-model
|
||||
--model local-model \
|
||||
--language english
|
||||
```
|
||||
|
||||
#### Anthropic Claude (via OpenAI-Kompatibilitätslayer)
|
||||
@@ -78,7 +80,8 @@ python meeting_summarizer.py meeting.mp3 \
|
||||
python meeting_summarizer.py meeting.mp3 \
|
||||
--api-base https://api.anthropic.com/v1 \
|
||||
--api-key $ANTHROPIC_API_KEY \
|
||||
--model claude-3-5-sonnet-20241022
|
||||
--model claude-3-5-sonnet-20241022 \
|
||||
--language german
|
||||
```
|
||||
|
||||
#### OpenRouter
|
||||
@@ -86,7 +89,8 @@ python meeting_summarizer.py meeting.mp3 \
|
||||
python meeting_summarizer.py meeting.mp3 \
|
||||
--api-base https://openrouter.ai/api/v1 \
|
||||
--api-key $OPENROUTER_API_KEY \
|
||||
--model anthropic/claude-3.5-sonnet
|
||||
--model anthropic/claude-3.5-sonnet \
|
||||
--language spanish
|
||||
```
|
||||
|
||||
## Verwendung
|
||||
@@ -107,6 +111,7 @@ Dies erstellt:
|
||||
python meeting_summarizer.py meeting.wav \
|
||||
--whisper-model medium \
|
||||
--model gpt-4 \
|
||||
--language german \
|
||||
--output-dir ./summaries \
|
||||
--api-base https://api.openai.com/v1
|
||||
```
|
||||
@@ -127,6 +132,9 @@ Optionen:
|
||||
|
||||
--model MODEL LLM-Modellname (default: gpt-4)
|
||||
|
||||
--language LANG Sprache für die Zusammenfassung (default: english)
|
||||
Beispiele: english, german, spanish, french, turkish
|
||||
|
||||
--output-dir DIR Ausgabeverzeichnis für Transkript und Zusammenfassung
|
||||
(default: gleiches Verzeichnis wie Audio-Datei)
|
||||
|
||||
@@ -158,6 +166,32 @@ Alle Formate, die von ffmpeg unterstützt werden:
|
||||
- WMA
|
||||
- AAC
|
||||
|
||||
## Sprach-Handling
|
||||
|
||||
Das Programm unterscheidet zwischen zwei Spracheinstellungen:
|
||||
|
||||
### Transkription (Input)
|
||||
- **Whisper erkennt die Sprache automatisch** - du musst nichts einstellen
|
||||
- Die Audio-Datei kann in jeder Sprache sein (Deutsch, Englisch, Spanisch, etc.)
|
||||
- Whisper transkribiert das Audio in der Originalsprache
|
||||
|
||||
### Zusammenfassung (Output)
|
||||
- **Der `--language` Parameter steuert die Ausgabesprache** der Zusammenfassung
|
||||
- Du kannst z.B. ein deutsches Meeting transkribieren und eine englische Zusammenfassung erhalten
|
||||
- Alle Prompts an das LLM sind auf Englisch, aber das LLM antwortet in der gewünschten Sprache
|
||||
|
||||
**Beispiel:**
|
||||
```bash
|
||||
# Deutsches Meeting → Deutsche Zusammenfassung
|
||||
python meeting_summarizer.py german-meeting.mp3 --language german
|
||||
|
||||
# Deutsches Meeting → Englische Zusammenfassung
|
||||
python meeting_summarizer.py german-meeting.mp3 --language english
|
||||
|
||||
# Türkisches Meeting → Türkische Zusammenfassung
|
||||
python meeting_summarizer.py turkish-meeting.mp3 --language turkish
|
||||
```
|
||||
|
||||
## Programmatische Verwendung
|
||||
|
||||
Du kannst das Programm auch als Modul verwenden:
|
||||
@@ -170,7 +204,8 @@ summarizer = MeetingSummarizer(
|
||||
whisper_model="base",
|
||||
api_base_url="http://localhost:11434/v1",
|
||||
api_key="ollama",
|
||||
model_name="llama3.2"
|
||||
model_name="llama3.2",
|
||||
output_language="german"
|
||||
)
|
||||
|
||||
# Verarbeite ein Meeting
|
||||
@@ -193,7 +228,8 @@ print(summary)
|
||||
### Für bessere Qualität:
|
||||
- Nutze größere Whisper-Modelle (`medium` oder `large`)
|
||||
- Stelle sicher, dass die Audio-Qualität gut ist
|
||||
- Bei mehrsprachigen Meetings: Entferne `language="de"` im Code für Auto-Detection
|
||||
- Whisper erkennt die Sprache des Audios automatisch
|
||||
- Mit `--language` bestimmst du die Sprache der **Zusammenfassung**, nicht der Transkription
|
||||
|
||||
## Tipps für embedded Systems
|
||||
|
||||
|
||||
2
requirements.txt
Normal file
2
requirements.txt
Normal file
@@ -0,0 +1,2 @@
|
||||
openai-whisper>=20231117
|
||||
openai>=1.0.0
|
||||
Reference in New Issue
Block a user