Обновлено: июнь 2026

Вы провели интервью, диктофон записал час разговора — а дальше начинается самое муторное. Чтобы вытащить из аудио живую цитату для статьи или поста, его нужно превратить в текст, и многие журналисты теряют на этом вечера. Разберём, как сделать расшифровку интервью в текст на русском: какие есть способы, почему важно разделение по говорящим, как находить цитаты поиском и что нужно знать про согласие на запись.

Что такое расшифровка интервью и зачем она журналисту

Транскрибация, расшифровка, транскрипт — что это простыми словами

Транскрибация, расшифровка и транскрипт — это всё про одно и то же: превращение аудиозаписи разговора в текст, который можно читать, искать и копировать. «Транскрибировать интервью», «расшифровать диктофонную запись», «перевести интервью в текст» — слова разные, смысл один. Раньше под этим понимали ручную работу, сегодня — автоматическое распознавание речи, когда программа сама превращает голос в текст на русском.

Зачем журналисту и блогеру текст интервью, а не только аудио

Аудио — это сырьё: в статью вы вставляете не звук, а слова. Текст интервью нужен ради конкретного результата:

  • точные цитаты для статьи или репортажа;
  • материал для поста в блоге или Telegram-канале;
  • основа для разбора — сравнить ответы нескольких героев или собрать факты воедино.

По аудиофайлу цитату не вставишь, а переслушивать час записи ради одной фразы — расточительство. Кстати, если вы исследователь и проводите серию глубинных интервью ради инсайтов, а не цитат, для вас есть отдельный разбор — глубинные интервью и CustDev. А здесь речь про журналистов и блогеров, у которых одна ясная цель — корректная цитата в публикацию.

Сколько времени отнимает ручная расшифровка интервью

Главная боль расшифровки в том, что час аудио — это не час работы. На практике выходит заметно дольше: вы не просто печатаете под диктовку, а постоянно ставите на паузу, отматываете назад, переслушиваете неразборчивые места. Время утекает на мелочах:

  • неразборчивая речь — бубнёж, тихий голос, акцент;
  • перебивания, когда собеседники говорят одновременно;
  • фоновый шум в кафе или на улице;
  • проверка имён, названий, терминов — их легко расслышать неправильно.

Точных нормативов тут нет — у всех своя скорость печати. Для одного короткого интервью это терпимо, но если вы ведёте рубрику, подкаст или готовите серию материалов, ручная расшифровка превращается в марафон, который отнимает время у самой важной части — у статьи.

Способы расшифровать интервью: вручную, фрилансер, автосервис

Расшифровка вручную: когда оправдана

Плюсы ручной расшифровки честные: полный контроль над текстом и приватность — запись не уходит никому. Если у вас одно короткое интервью на пять минут, иногда проще напечатать самому. Минус мы уже разобрали: долго и выматывает, на потоке такой способ не работает.

Транскрибатор-фрилансер: сроки, бюджет и приватность

Фрилансер-транскрибатор снимает с вас рутину — вы отдаёте файл и получаете готовый текст. Но есть три «но»: это деньги; это сроки — придётся ждать; и главное — приватность. Вы передаёте постороннему человеку запись с именами, контактами и личными историями собеседника, а готов ли ваш герой к тому, что его слова услышит кто-то ещё, — вопрос открытый.

Автоматический сервис: на что смотреть при выборе

Автоматический сервис работает быстро: загрузили — получили текст. Но для интервью на русском важны три вещи:

  1. Сильный русский из коробки — чтобы не править за программой каждое слово.
  2. Разделение по говорящим (диаризация) — чтобы вопросы не слипались с ответами героя.
  3. Безопасность данных — что происходит с записью после загрузки и где она обрабатывается.

Диаризация: кто говорит — интервьюер или респондент

Что такое диаризация и почему без неё текст интервью бесполезен

Диаризация — слово страшное, но смысл простой: это когда в расшифровке видно, кто произнёс каждую реплику. Текст распадается на «спросил журналист» и «ответил герой», а не валится сплошным полотном.

Представьте час разговора в виде стены текста без разметки: вопросы и ответы слипаются в одну кашу, и чтобы вытащить нужную цитату, приходится по памяти восстанавливать, где была ваша реплика, а где — слова собеседника. А журналисту нужны именно слова героя — они и идут в публикацию.

Как разделение по говорящим помогает быстро вытащить цитату героя

Когда реплики уже размечены, цитату героя видно с первого взгляда — её можно скопировать, не разбирая, кто это сказал.

Сонар делает диаризацию автоматически — функция работает на проде, реплики уже разделены по говорящим. Оговоримся честно: речь именно про автоматическое разделение голосов, движок сам определяет, где сменился спикер.

Интервью с несколькими собеседниками и круглые столы

Если в разговоре участвует не два человека, а трое-четверо или это вовсе круглый стол, диаризация спасает вдвойне. Без разделения по говорящим разобрать, кто что сказал, почти нереально — особенно через неделю, когда детали стёрлись из памяти.

Поиск по тексту: как быстро находить цитаты для публикации

Поиск по расшифровке вместо переслушивания записи

Когда интервью стало текстом, открывается главное удобство — поиск. Вы помните, что герой говорил что-то про «сроки запуска», но не помните, на какой минуте. Вместо того чтобы переслушивать час аудио, набираете ключевое слово и сразу попадаете на нужную реплику — цитата находится за секунды, а не за полчаса перемоток. В Сонаре поиск по архиву и полнотекстовый, и смысловой: можно искать не только по точному слову, но и по смыслу.

Папки по материалам и проектам

Чтобы интервью не превращались в свалку, их удобно раскладывать по папкам — по материалам, проектам, выпускам. Готовите большой текст из пяти интервью — собрали их в одну папку, ничего не потерялось. А краткое AI-саммари каждой записи помогает вспомнить, о чём был разговор, не открывая весь транскрипт.

Сверяйте цитаты с аудио: ИИ может ошибаться

Важная оговорка. Автоматическая расшифровка и саммари — это работа искусственного интеллекта, а ИИ может ошибаться: перепутать слово, неправильно расслышать имя или термин, особенно на записи с шумом.

Поэтому правило простое: дословную цитату перед публикацией обязательно сверяйте с исходным аудио. Инструмент помогает быстро найти нужное место и освежить разговор в памяти — но финальная проверка точности цитаты остаётся за вами. К каждой реплике в Сонаре есть тайм-код, так что найти место в аудио — секундное дело.

Согласие на запись интервью и безопасность данных (152-ФЗ)

Нужно ли согласие собеседника и что изменилось с 1 сентября 2025

Записывать интервью с человеком нужно с его согласия — это и правило вежливости, и требование закона. Предупредить, что идёт запись, стоит до начала разговора. Если интервью по телефону — скажите о записи в самом начале, до первых вопросов.

Здесь важный факт: с 1 сентября 2025 года (по ФЗ № 156-ФЗ от 24.06.2025) согласие на обработку персональных данных оформляется отдельным документом — его больше нельзя «спрятать» в общий текст другого соглашения. Если вы работаете с персональными данными собеседников, это стоит учитывать. Статья носит ознакомительный характер и не является юридической консультацией — по конкретной ситуации лучше обратиться к юристу.

Обработка на сервере в России: данные не уходят за рубеж

Загружая запись в сервис, важно понимать, где она обрабатывается. Сонар считает всё на собственном сервере в России — аудио и транскрипты хранятся в российском дата-центре и не уходят за рубеж. Это существенно в контексте 152-ФЗ. Подробнее — в материале про безопасность данных и 152-ФЗ.

Чем и где расшифровывать интервью: iPhone, Apple Watch, бот в созвоне

Очное интервью: запись с iPhone и Apple Watch

Если вы встречаетесь с героем лично, разговор можно записать прямо с iPhone или Apple Watch — отдельный диктофон не нужен, и запись сразу превращается в текст на русском. Smart-запись не тратит минуты на тишину и долгие паузы.

И здесь важный факт: Apple официально не поддерживает расшифровку русской речи во встроенных Диктофоне и Заметках iPhone и на Apple Watch — стандартные приложения вам русский текст не выдадут, нужен отдельный инструмент. Подробнее — почему iPhone не расшифровывает русский.

Онлайн-интервью и созвон: бот в звонке или загрузка файла

Если интервью прошло онлайн, есть два пути. Первый — пригласить в созвон meeting-бота Сонара по invite-ссылке: он заходит как участник в Яндекс Телемост, Zoom или Google Meet (Microsoft Teams — в роудмапе), а после встречи отдаёт расшифровку, AI-саммари, задачи и тайм-коды. Второй — если запись уже сделана, просто загрузить готовый аудиофайл в веб-кабинет в браузере, обработка та же.

Анализ расшифровок в браузере на компьютере

Веб-кабинет открывается в любом браузере, в том числе на Android-телефоне. А разбирать расшифровки удобнее на большом экране — там поиск, папки, тайм-коды и весь текст перед глазами. По архиву можно ещё и спросить в чате «Спросить»: задать вопрос по всем записям и получить ответ со ссылками на нужные места.

Сонар против Otter.ai и других сервисов для интервью

Чем Сонар отличается от Otter.ai для русских интервью

Otter.ai — известный западный сервис, но для русских интервью у него большие минусы: слабый русский с ошибками, интерфейс на английском — и он не принимает российскую карту. Для журналиста, работающего с русскоязычными героями, это серьёзная преграда.

Кстати, в статьях-сравнениях часто пишут красивые проценты точности вроде «99%» — относитесь к ним скептически, обычно такие цифры берутся из ниоткуда. Честнее сказать качественно: русский у Otter.ai слабый.

Сонар устроен иначе: русский из коробки на движке GigaAM v3, оплата обычной российской картой, обработка в России, автоматическая диаризация, поиск и папки. Подробное сравнение — в материале Сонар против Otter.ai.

Готовый инструмент против API (SaluteSpeech, Yandex SpeechKit)

Иногда вспоминают SaluteSpeech от Сбера и Yandex SpeechKit. Важно понимать: это API для разработчиков, а не готовое приложение — чтобы ими пользоваться, нужен программист. Журналисту, которому нужно «загрузил — получил текст», это не подойдёт.

Есть и другие сервисы — у каждого стоит проверять качество русского, разделение по говорящим и то, где хранятся данные, прямо на своих записях. Обзор вариантов — лучшие нейросети для расшифровки 2026.

Сравнительная таблица

Что важно журналистуСонарOtter.ai
Русский языкИз коробки (GigaAM v3)Слабый, с ошибками
Оплата российской картойДа, карта, СБП, ЮMoneyНет
Где обрабатываются данныеСервер в РоссииЗа рубежом
Разделение по говорящимДа, автоматическиОграниченно
Поиск и папкиДа, полнотекстовый и смысловойОграниченно
ПлатформыiPhone, Apple Watch, веб, бот в созвонеВеб, моб. приложения

Как расшифровать первое интервью за несколько минут

Весь путь — три шага.

  1. Записать, загрузить или пригласить бота. Очное интервью пишете прямо с iPhone или Apple Watch. Онлайн-созвон — приглашаете бота по ссылке или загружаете готовый аудиофайл в веб-кабинет.
  2. Получить текст. Сонар выдаёт расшифровку с разделением по говорящим, тайм-кодами и кратким саммари, чтобы сразу вспомнить суть разговора.
  3. Найти цитаты. Поиском находите нужные реплики героя — и обязательно сверяете дословную цитату с аудио перед публикацией.

На тарифе Старт это бесплатно: 120 минут в месяц, чтобы проверить инструмент на своих интервью и понять, подходит ли он вам.

Частые вопросы

Как перевести интервью в текст онлайн на русском?

Загрузите готовую аудиозапись в веб-кабинет в браузере, запишите разговор с iPhone или Apple Watch, либо пригласите meeting-бота Сонара в созвон по invite-ссылке. Сервис распознаёт русскую речь на движке GigaAM v3 и выдаёт текст. Важно выбирать инструмент с сильным русским из коробки: встроенные Диктофон и Заметки iPhone официально русскую расшифровку не поддерживают.

Можно ли расшифровать интервью с разделением на интервьюера и респондента?

Да. Это называется диаризацией — в расшифровке видно, где реплика журналиста, а где ответ героя. Сонар делает такое разделение по говорящим автоматически, движок сам определяет смену спикера. Для интервью с несколькими участниками и круглых столов это особенно полезно.

Можно ли использовать дословные цитаты из автоматической расшифровки для публикации?

Использовать можно, но дословную цитату обязательно сверяйте с исходным аудио. Расшифровка — работа ИИ, в ней бывают ошибки в словах, именах и терминах. К каждой реплике есть тайм-код, поэтому найти нужное место в записи легко, а финальная проверка точности цитаты остаётся ответственностью журналиста.

Нужно ли согласие собеседника на запись интервью и что изменилось с 1 сентября 2025?

Записывать человека нужно с его согласия, а в телефонном интервью — предупредить о записи в начале разговора. С 1 сентября 2025 года (ФЗ № 156-ФЗ от 24.06.2025) согласие на обработку персональных данных оформляется отдельным документом. Это ознакомительная информация, а не юридическая консультация — по своей ситуации обратитесь к юристу.

Где хранятся записи и транскрипты интервью?

В Сонаре всё считается на собственном сервере в России: аудио и транскрипты лежат в российском дата-центре и не уходят за рубеж. Это важно в контексте 152-ФЗ, особенно когда в записи звучат персональные данные собеседников. Подробнее — в материале про безопасность данных и 152-ФЗ.

Можно ли расшифровать онлайн-интервью из Zoom или Телемоста?

Да, двумя способами. Можно пригласить meeting-бота Сонара в созвон по invite-ссылке — он зайдёт участником в Яндекс Телемост, Zoom или Google Meet и после встречи отдаст расшифровку с саммари и тайм-кодами. А если запись уже сделана, достаточно загрузить готовый аудиофайл в веб-кабинет.

Сколько стоит расшифровка интервью в Сонаре?

Есть бесплатный тариф Старт — 120 минут в месяц. Тариф Рабочий стоит 490 ₽/мес и даёт 1200 минут, Профи — 1490 ₽/мес и 4000 минут. При оплате за год действует скидка. Платить можно российской картой, через СБП или ЮMoney.

Что почитать дальше

Источники

  • Федеральный закон № 156-ФЗ от 24.06.2025 — о порядке оформления согласия на обработку персональных данных отдельным документом (вступил в силу 1 сентября 2025 года).