Загрузка файлов

SpeakFlow позволяет загружать аудио и видео файлы для транскрипции.

Поддерживаемые форматы

Аудио

MP3

Самый популярный формат

WAV

Без сжатия

M4A

Apple формат

OGG

Открытый формат

FLAC

Lossless качество

AAC

Высокое сжатие

Видео

MP4

Универсальный формат

MOV

Apple QuickTime

AVI

Windows формат

MKV

Matroska

WEBM

Web формат

FLV

Flash Video

Как загрузить файл

1

Откройте приложение

Запустите SpeakFlow
2

Перейдите в раздел 'Файлы'

Нажмите на вкладку “Загрузка файлов”
3

Выберите файл

Нажмите “Выбрать файл” или перетащите файл в окно
4

Настройте параметры

Выберите язык и другие опции
5

Начните транскрипцию

Нажмите “Транскрибировать”
Вы можете загружать несколько файлов одновременно — они будут обработаны в очереди

Ограничения

ПараметрFreePersonalTeam
Максимальный размер25 MB100 MB500 MB
Длительность10 мин2 часа5 часов
Файлов в месяц5100Безлимит
Скорость обработки1x3x5x
Скорость обработки: 1x означает что файл длиной 10 минут обработается за ~10 минут

Настройки транскрипции

При загрузке файла вы можете настроить:

Язык

  • Автоопределение (по умолчанию)
  • Фиксированный язык (русский, английский и т.д.)
Автоопределение может ошибаться на коротких файлах. Для лучшей точности выбирайте язык вручную.

Качество

  • Быстрое — обработка в 3x скорости, точность ~90%
  • Стандартное — 1x скорость, точность ~95%
  • Высокое — 0.5x скорость, точность ~98%

Дополнительные опции

  • Временные метки — добавить время к каждому блоку текста
  • Идентификация спикеров — разделение по говорящим
  • Удаление пауз — убрать длинные паузы из текста
  • Фильтрация мата — автоцензура

Временные метки

Пример с временными метками:
[00:00:05] Добрый день, сегодня мы поговорим о транскрипции.
[00:00:12] Это очень полезная функция для записи лекций и встреч.
[00:00:20] Давайте рассмотрим основные возможности.
Включить: Настройки загрузки → Временные метки

Идентификация спикеров

Автоматическое определение разных говорящих:
Спикер 1: Здравствуйте, как дела?
Спикер 2: Отлично, спасибо!
Спикер 1: Давайте начнём встречу.
Спикер 3: Хорошо, я готов.
Работает для файлов с чётким разделением голосов. Количество спикеров определяется автоматически.

Экспорт результатов

После транскрипции вы можете экспортировать в:

TXT

Простой текст

DOCX

Microsoft Word

PDF

С форматированием

SRT

Субтитры для видео

VTT

WebVTT субтитры

JSON

Структурированные данные

Примеры использования

Загрузите запись лекции → Получите текстовую версию для изучения
Запись Zoom/Meet → Транскрипция → Краткая выжимка с помощью AI
Аудио файл подкаста → Текст → Публикация на сайте для SEO
Видео файл → Транскрипция с метками → Экспорт в SRT → Добавление в видео
Голосовые сообщения из мессенджеров → Текст

Приватность

Все загруженные файлы шифруются и удаляются с серверов после обработки (в течение 24 часов)

Что дальше?