Przejdź do głównej treści

Transkrypcja audio i protokoły z spotkań

AI-Public oferuje potężne możliwości transkrypcji, przekształcające dźwięk w tekst przy użyciu real-time API OpenAI. Transkrypcja odbywa się na żywo, dzięki czemu możesz od razu zweryfikować, czy tekst jest poprawny. Możesz także automatycznie generować protokoły ze spotkań na podstawie transkrypcji.

Strona startowa

Na stronie startowej modułu transkrypcji możesz wybrać między nową nagrywką w czasie rzeczywistym a przesłaniem istniejącego pliku audio.

Dostarczanie audio

Istnieją dwa sposoby dostarczenia audio do transkrypcji:

Bezpośrednie nagrywanie w AI-Public

Kliknij duży przycisk „Rozpocznij nagrywanie”, aby rozpocząć nagrywanie w czasie rzeczywistym. Zanim nagranie się rozpocznie, pojawi się okno dialogowe z ustawieniami nagrywania:

Ustawienia nagrywania

Podczas rozpoczynania nagrania można skonfigurować różne ustawienia:

  1. Rodzaj nagrania: Wybierz typ nagrania, aby zoptymalizować jakość dźwięku:

    • Nagranie prywatne: dla jednej osoby blisko mikrofonu (podcast, notatki osobiste)
    • Spotkanie (domyślne): dla wielu mówców w jednym pomieszczeniu
    • Lekcja lub prezentacja: dla jednego głównego mówcy z możliwą interakcją

    W zależności od wyboru zastosowany zostanie odpowiedni filtr audio:

    • Filtr near-field dla nagrań prywatnych
    • Brak filtra dla spotkań (aby uchwycić wszystkich mówców)
    • Filtr far-field dla lekcji i prezentacji
  2. Nagrywanie audio: Wybierz, czy chcesz zapisać dźwięk podczas transkrypcji

    • Tak: audio zapisuje się w Firebase Storage
    • Nie: tylko tekst transkrypcji jest przechowywany
  3. Interwał przesyłania audio (tylko jeśli wybierasz nagrywanie audio):

    • Ustaw interwał (1-15 minut), po którym audio jest zapisywane
    • Domyślnie: 5 minut
    • Krótsze interwały (np. 1-2 min): więcej plików audio, ale bezpieczniejsze przy awariach komputera
    • Dłuższe interwały (np. 10-15 min): mniej plików, ale ryzyko utraty przy problemach technicznych

Użyj istniejącego pliku audio

Możesz także przesłać wcześniej nagrany plik audio do AI-Public. Kliknij przycisk „Wybierz plik audio” i wybierz plik. Obsługiwane formaty: MP3, WAV, M4A i WebM.

Transkrypcja na żywo

Podczas transkrypcji AI-Public korzysta z real-time API OpenAI. Oznacza to, że możesz na bieżąco czytać lub sprawdzić, czy transkrypcja jest prawidłowa.

Uwaga: jeśli transkrypcja nie odpowiada w 100% treści mówionej:

  • Mów wyraźniej i artykuj lepiej
  • Sprawdź, czy używasz dobrego mikrofonu
  • Upewnij się, że mikrofon znajduje się wystarczająco blisko mówiącego
  • Wybierz odpowiedni typ nagrania w ustawieniach

Protokół ze spotkania

Po nagraniu i transkrypcji możesz automatycznie wygenerować protokół ze spotkania. Przełącz się na zakładkę „Protokół ze spotkania” i kliknij przycisk „Generuj protokół ze spotkania”.

Protokoł ze spotkania jest automatycznie generowany na podstawie transkrypcji i aktywnego promptu.

Zaawansowane ustawienia

Zarządzanie promptami

Możesz w pełni dostosować i zarządzać promptami do protokołu ze spotkania. Kliknij przycisk „Konfiguruj prompt”, aby otworzyć okno dialogowe promptu.

Domyślne prompty

AI-Public oferuje dwa standardowe prompt:

  1. Standardowe spotkanie: tworzy strukturalny protokół ze spotkania z ogólnymi sekcjami
  2. Z rozpoznaniem mówców: tworzy protokół ze spotkania z rozpoznaniem mówców i przypisuje każdemu mówcy unikalny numer

Własne prompty

Możesz także tworzyć własne, niestandardowe prompty:

  • Kliknij „Dodaj własny prompt”
  • Nadaj promptowi nazwę
  • Napisz instrukcje, jak protokół ze spotkania powinien być opracowywany
  • Zapisz prompt

Wszystkie niestandardowe prompty są przechowywane w Twoim koncie i są dostępne od razu do przyszłych transkrypcji.

Zarządzanie historią

Możesz przeglądać i zarządzać historią wcześniejszych transkrypcji za pomocą przycisku „Historia”.

W historii możesz:

  • Wyszukiwać transkrypcje po tytule, dacie lub treści
  • Edytować tytuły klikając ikonę ołówka
  • Ładować transkrypcje, aby ponownie je obejrzeć lub edytować
  • Usuwać transkrypcje już niepotrzebne
  • Odtwarzać audio, jeśli transkrypcja zawiera nagrania audio

Wykorzystanie transkrypcji

Możesz użyć transkrypcji na różne sposoby:

  • Kopiuj: skopiuj transkrypcję za pomocą przycisku kopiowania
  • Eksport do PDF: pobierz transkrypcję jako dokument PDF
  • W użyciu w czacie: wklej transkrypcję w czacie, aby zadawać pytania lub generować analizy
  • Eksport protokołu ze spotkania: eksportuj protokół ze spotkania do PDF lub Word

Automatyczne udostępnianie audio

Podczas live transkrypcji AI-Public może zapisywać audio w częściach. Te części są w tle przesyłane na serwer i przetwarzane, aby długie nagrania były lepiej chronione w przypadku przerwy w połączeniu, przeglądarce lub urządzeniu.

Interwałowa wysyłka nie przerywa już live nagrywania. Każdy interwał jest zapisywany jako samodzielny plik WAV, aby serwis przetwarzający otrzymał kompletny i prawidłowy plik audio. Ostatnia część jest zapisywana również po zakończeniu nagrywania.

Jeśli przetwarzanie części audio zakończy się niepowodzeniem, samo nagranie może kontynuować. Sprawdź po zakończeniu status pliku i przesyłaj bądź przetwarzaj część ponownie, jeśli to konieczne.