Обновлено: июнь 2026
Вы провели интервью, диктофон записал час разговора — а дальше начинается самое муторное. Чтобы вытащить из аудио живую цитату для статьи или поста, его нужно превратить в текст, и многие журналисты теряют на этом вечера. Разберём, как сделать расшифровку интервью в текст на русском: какие есть способы, почему важно разделение по говорящим, как находить цитаты поиском и что нужно знать про согласие на запись.
Что такое расшифровка интервью и зачем она журналисту
Транскрибация, расшифровка, транскрипт — что это простыми словами
Транскрибация, расшифровка и транскрипт — это всё про одно и то же: превращение аудиозаписи разговора в текст, который можно читать, искать и копировать. «Транскрибировать интервью», «расшифровать диктофонную запись», «перевести интервью в текст» — слова разные, смысл один. Раньше под этим понимали ручную работу, сегодня — автоматическое распознавание речи, когда программа сама превращает голос в текст на русском.
Зачем журналисту и блогеру текст интервью, а не только аудио
Аудио — это сырьё: в статью вы вставляете не звук, а слова. Текст интервью нужен ради конкретного результата:
- точные цитаты для статьи или репортажа;
- материал для поста в блоге или Telegram-канале;
- основа для разбора — сравнить ответы нескольких героев или собрать факты воедино.
По аудиофайлу цитату не вставишь, а переслушивать час записи ради одной фразы — расточительство. Кстати, если вы исследователь и проводите серию глубинных интервью ради инсайтов, а не цитат, для вас есть отдельный разбор — глубинные интервью и CustDev. А здесь речь про журналистов и блогеров, у которых одна ясная цель — корректная цитата в публикацию.
Сколько времени отнимает ручная расшифровка интервью
Главная боль расшифровки в том, что час аудио — это не час работы. На практике выходит заметно дольше: вы не просто печатаете под диктовку, а постоянно ставите на паузу, отматываете назад, переслушиваете неразборчивые места. Время утекает на мелочах:
- неразборчивая речь — бубнёж, тихий голос, акцент;
- перебивания, когда собеседники говорят одновременно;
- фоновый шум в кафе или на улице;
- проверка имён, названий, терминов — их легко расслышать неправильно.
Точных нормативов тут нет — у всех своя скорость печати. Для одного короткого интервью это терпимо, но если вы ведёте рубрику, подкаст или готовите серию материалов, ручная расшифровка превращается в марафон, который отнимает время у самой важной части — у статьи.
Способы расшифровать интервью: вручную, фрилансер, автосервис
Расшифровка вручную: когда оправдана
Плюсы ручной расшифровки честные: полный контроль над текстом и приватность — запись не уходит никому. Если у вас одно короткое интервью на пять минут, иногда проще напечатать самому. Минус мы уже разобрали: долго и выматывает, на потоке такой способ не работает.
Транскрибатор-фрилансер: сроки, бюджет и приватность
Фрилансер-транскрибатор снимает с вас рутину — вы отдаёте файл и получаете готовый текст. Но есть три «но»: это деньги; это сроки — придётся ждать; и главное — приватность. Вы передаёте постороннему человеку запись с именами, контактами и личными историями собеседника, а готов ли ваш герой к тому, что его слова услышит кто-то ещё, — вопрос открытый.
Автоматический сервис: на что смотреть при выборе
Автоматический сервис работает быстро: загрузили — получили текст. Но для интервью на русском важны три вещи:
- Сильный русский из коробки — чтобы не править за программой каждое слово.
- Разделение по говорящим (диаризация) — чтобы вопросы не слипались с ответами героя.
- Безопасность данных — что происходит с записью после загрузки и где она обрабатывается.
Диаризация: кто говорит — интервьюер или респондент
Что такое диаризация и почему без неё текст интервью бесполезен
Диаризация — слово страшное, но смысл простой: это когда в расшифровке видно, кто произнёс каждую реплику. Текст распадается на «спросил журналист» и «ответил герой», а не валится сплошным полотном.
Представьте час разговора в виде стены текста без разметки: вопросы и ответы слипаются в одну кашу, и чтобы вытащить нужную цитату, приходится по памяти восстанавливать, где была ваша реплика, а где — слова собеседника. А журналисту нужны именно слова героя — они и идут в публикацию.
Как разделение по говорящим помогает быстро вытащить цитату героя
Когда реплики уже размечены, цитату героя видно с первого взгляда — её можно скопировать, не разбирая, кто это сказал.
Сонар делает диаризацию автоматически — функция работает на проде, реплики уже разделены по говорящим. Оговоримся честно: речь именно про автоматическое разделение голосов, движок сам определяет, где сменился спикер.
Интервью с несколькими собеседниками и круглые столы
Если в разговоре участвует не два человека, а трое-четверо или это вовсе круглый стол, диаризация спасает вдвойне. Без разделения по говорящим разобрать, кто что сказал, почти нереально — особенно через неделю, когда детали стёрлись из памяти.
Поиск по тексту: как быстро находить цитаты для публикации
Поиск по расшифровке вместо переслушивания записи
Когда интервью стало текстом, открывается главное удобство — поиск. Вы помните, что герой говорил что-то про «сроки запуска», но не помните, на какой минуте. Вместо того чтобы переслушивать час аудио, набираете ключевое слово и сразу попадаете на нужную реплику — цитата находится за секунды, а не за полчаса перемоток. В Сонаре поиск по архиву и полнотекстовый, и смысловой: можно искать не только по точному слову, но и по смыслу.
Папки по материалам и проектам
Чтобы интервью не превращались в свалку, их удобно раскладывать по папкам — по материалам, проектам, выпускам. Готовите большой текст из пяти интервью — собрали их в одну папку, ничего не потерялось. А краткое AI-саммари каждой записи помогает вспомнить, о чём был разговор, не открывая весь транскрипт.
Сверяйте цитаты с аудио: ИИ может ошибаться
Важная оговорка. Автоматическая расшифровка и саммари — это работа искусственного интеллекта, а ИИ может ошибаться: перепутать слово, неправильно расслышать имя или термин, особенно на записи с шумом.
Поэтому правило простое: дословную цитату перед публикацией обязательно сверяйте с исходным аудио. Инструмент помогает быстро найти нужное место и освежить разговор в памяти — но финальная проверка точности цитаты остаётся за вами. К каждой реплике в Сонаре есть тайм-код, так что найти место в аудио — секундное дело.
Согласие на запись интервью и безопасность данных (152-ФЗ)
Нужно ли согласие собеседника и что изменилось с 1 сентября 2025
Записывать интервью с человеком нужно с его согласия — это и правило вежливости, и требование закона. Предупредить, что идёт запись, стоит до начала разговора. Если интервью по телефону — скажите о записи в самом начале, до первых вопросов.
Здесь важный факт: с 1 сентября 2025 года (по ФЗ № 156-ФЗ от 24.06.2025) согласие на обработку персональных данных оформляется отдельным документом — его больше нельзя «спрятать» в общий текст другого соглашения. Если вы работаете с персональными данными собеседников, это стоит учитывать. Статья носит ознакомительный характер и не является юридической консультацией — по конкретной ситуации лучше обратиться к юристу.
Обработка на сервере в России: данные не уходят за рубеж
Загружая запись в сервис, важно понимать, где она обрабатывается. Сонар считает всё на собственном сервере в России — аудио и транскрипты хранятся в российском дата-центре и не уходят за рубеж. Это существенно в контексте 152-ФЗ. Подробнее — в материале про безопасность данных и 152-ФЗ.
Чем и где расшифровывать интервью: iPhone, Apple Watch, бот в созвоне
Очное интервью: запись с iPhone и Apple Watch
Если вы встречаетесь с героем лично, разговор можно записать прямо с iPhone или Apple Watch — отдельный диктофон не нужен, и запись сразу превращается в текст на русском. Smart-запись не тратит минуты на тишину и долгие паузы.
И здесь важный факт: Apple официально не поддерживает расшифровку русской речи во встроенных Диктофоне и Заметках iPhone и на Apple Watch — стандартные приложения вам русский текст не выдадут, нужен отдельный инструмент. Подробнее — почему iPhone не расшифровывает русский.
Онлайн-интервью и созвон: бот в звонке или загрузка файла
Если интервью прошло онлайн, есть два пути. Первый — пригласить в созвон meeting-бота Сонара по invite-ссылке: он заходит как участник в Яндекс Телемост, Zoom или Google Meet (Microsoft Teams — в роудмапе), а после встречи отдаёт расшифровку, AI-саммари, задачи и тайм-коды. Второй — если запись уже сделана, просто загрузить готовый аудиофайл в веб-кабинет в браузере, обработка та же.
Анализ расшифровок в браузере на компьютере
Веб-кабинет открывается в любом браузере, в том числе на Android-телефоне. А разбирать расшифровки удобнее на большом экране — там поиск, папки, тайм-коды и весь текст перед глазами. По архиву можно ещё и спросить в чате «Спросить»: задать вопрос по всем записям и получить ответ со ссылками на нужные места.
Сонар против Otter.ai и других сервисов для интервью
Чем Сонар отличается от Otter.ai для русских интервью
Otter.ai — известный западный сервис, но для русских интервью у него большие минусы: слабый русский с ошибками, интерфейс на английском — и он не принимает российскую карту. Для журналиста, работающего с русскоязычными героями, это серьёзная преграда.
Кстати, в статьях-сравнениях часто пишут красивые проценты точности вроде «99%» — относитесь к ним скептически, обычно такие цифры берутся из ниоткуда. Честнее сказать качественно: русский у Otter.ai слабый.
Сонар устроен иначе: русский из коробки на движке GigaAM v3, оплата обычной российской картой, обработка в России, автоматическая диаризация, поиск и папки. Подробное сравнение — в материале Сонар против Otter.ai.
Готовый инструмент против API (SaluteSpeech, Yandex SpeechKit)
Иногда вспоминают SaluteSpeech от Сбера и Yandex SpeechKit. Важно понимать: это API для разработчиков, а не готовое приложение — чтобы ими пользоваться, нужен программист. Журналисту, которому нужно «загрузил — получил текст», это не подойдёт.
Есть и другие сервисы — у каждого стоит проверять качество русского, разделение по говорящим и то, где хранятся данные, прямо на своих записях. Обзор вариантов — лучшие нейросети для расшифровки 2026.
Сравнительная таблица
| Что важно журналисту | Сонар | Otter.ai |
|---|---|---|
| Русский язык | Из коробки (GigaAM v3) | Слабый, с ошибками |
| Оплата российской картой | Да, карта, СБП, ЮMoney | Нет |
| Где обрабатываются данные | Сервер в России | За рубежом |
| Разделение по говорящим | Да, автоматически | Ограниченно |
| Поиск и папки | Да, полнотекстовый и смысловой | Ограниченно |
| Платформы | iPhone, Apple Watch, веб, бот в созвоне | Веб, моб. приложения |
Как расшифровать первое интервью за несколько минут
Весь путь — три шага.
- Записать, загрузить или пригласить бота. Очное интервью пишете прямо с iPhone или Apple Watch. Онлайн-созвон — приглашаете бота по ссылке или загружаете готовый аудиофайл в веб-кабинет.
- Получить текст. Сонар выдаёт расшифровку с разделением по говорящим, тайм-кодами и кратким саммари, чтобы сразу вспомнить суть разговора.
- Найти цитаты. Поиском находите нужные реплики героя — и обязательно сверяете дословную цитату с аудио перед публикацией.
На тарифе Старт это бесплатно: 120 минут в месяц, чтобы проверить инструмент на своих интервью и понять, подходит ли он вам.
Частые вопросы
Как перевести интервью в текст онлайн на русском?
Загрузите готовую аудиозапись в веб-кабинет в браузере, запишите разговор с iPhone или Apple Watch, либо пригласите meeting-бота Сонара в созвон по invite-ссылке. Сервис распознаёт русскую речь на движке GigaAM v3 и выдаёт текст. Важно выбирать инструмент с сильным русским из коробки: встроенные Диктофон и Заметки iPhone официально русскую расшифровку не поддерживают.
Можно ли расшифровать интервью с разделением на интервьюера и респондента?
Да. Это называется диаризацией — в расшифровке видно, где реплика журналиста, а где ответ героя. Сонар делает такое разделение по говорящим автоматически, движок сам определяет смену спикера. Для интервью с несколькими участниками и круглых столов это особенно полезно.
Можно ли использовать дословные цитаты из автоматической расшифровки для публикации?
Использовать можно, но дословную цитату обязательно сверяйте с исходным аудио. Расшифровка — работа ИИ, в ней бывают ошибки в словах, именах и терминах. К каждой реплике есть тайм-код, поэтому найти нужное место в записи легко, а финальная проверка точности цитаты остаётся ответственностью журналиста.
Нужно ли согласие собеседника на запись интервью и что изменилось с 1 сентября 2025?
Записывать человека нужно с его согласия, а в телефонном интервью — предупредить о записи в начале разговора. С 1 сентября 2025 года (ФЗ № 156-ФЗ от 24.06.2025) согласие на обработку персональных данных оформляется отдельным документом. Это ознакомительная информация, а не юридическая консультация — по своей ситуации обратитесь к юристу.
Где хранятся записи и транскрипты интервью?
В Сонаре всё считается на собственном сервере в России: аудио и транскрипты лежат в российском дата-центре и не уходят за рубеж. Это важно в контексте 152-ФЗ, особенно когда в записи звучат персональные данные собеседников. Подробнее — в материале про безопасность данных и 152-ФЗ.
Можно ли расшифровать онлайн-интервью из Zoom или Телемоста?
Да, двумя способами. Можно пригласить meeting-бота Сонара в созвон по invite-ссылке — он зайдёт участником в Яндекс Телемост, Zoom или Google Meet и после встречи отдаст расшифровку с саммари и тайм-кодами. А если запись уже сделана, достаточно загрузить готовый аудиофайл в веб-кабинет.
Сколько стоит расшифровка интервью в Сонаре?
Есть бесплатный тариф Старт — 120 минут в месяц. Тариф Рабочий стоит 490 ₽/мес и даёт 1200 минут, Профи — 1490 ₽/мес и 4000 минут. При оплате за год действует скидка. Платить можно российской картой, через СБП или ЮMoney.
Что почитать дальше
- Транскрибация аудио в текст: базовый гайд
- Глубинные интервью и CustDev: гайд для исследователей
- Сонар против Otter.ai на русском
- Почему iPhone не расшифровывает русский
- Безопасность данных и 152-ФЗ
- Лучшие нейросети для расшифровки 2026
Источники
- Федеральный закон № 156-ФЗ от 24.06.2025 — о порядке оформления согласия на обработку персональных данных отдельным документом (вступил в силу 1 сентября 2025 года).