Обновлено: июнь 2026
Про то, как проводить интервью, в сети написано много: гайды по глубинным интервью, чек-листы для CustDev, разборы UX-исследований — выбирай любой. А вот про то, что делать, когда на руках уже лежат десятки записей живых разговоров, почти никто не пишет. Между тем именно здесь у исследователя и встаёт работа. Эта статья — про этап обработки: как сделать расшифровку глубинных интервью так, чтобы в тексте было видно, кто что сказал, чтобы по нему можно было искать сразу по всей серии и чтобы из него реально вытащить выводы.
Почему этап обработки интервью — самое узкое место
Представьте: вы провели серию из пятнадцати глубинных интервью. Само общение прошло хорошо — люди раскрылись, рассказали важное. А дальше начинается то, о чём в методичках обычно молчат: пятнадцать записей надо расшифровать, разметить, перечитать и свести в выводы. И вот тут время начинает утекать.
Сколько уходит на ручную расшифровку серии
Расшифровать руками один час разговора — это не один час работы. Приходится постоянно ставить на паузу, отматывать назад, переслушивать неразборчивые места, дописывать. На практике один час аудио легко превращается в несколько часов за клавиатурой. А теперь умножьте на всю серию. Сбор данных, как ни странно, оказывается не самой долгой частью исследования — самой долгой становится обработка.
Почему текст без разделения по говорящим бесполезен
Допустим, расшифровку вы всё же получили — сплошным полотном, без пометок, кто говорит. Открываете, а там вопросы модератора и ответы респондента слиплись в одну стену текста. Для анализа это почти бесполезно: вам важны именно ответы собеседника, его слова, его боли, а не ваши собственные вопросы. Чтобы текст начал работать, в нём должно быть видно, где спрашивал исследователь, а где отвечал участник.
Что должно случиться с записью после интервью
Если коротко, с каждой записью после беседы должно произойти четыре вещи: расшифровка в текст, разметка по говорящим, возможность искать по репликам и, наконец, выводы. Об этом и пойдёт речь дальше — по порядку.
Глубинное интервью, CustDev и UX-ресёрч простыми словами
Прежде чем нырять в обработку, коротко разведём понятия — для тех, кто только подбирает термины.
В чём разница для исследователя
Глубинное интервью — формат глубокой беседы один на один, когда вы не анкету заполняете, а долго и подробно разговариваете с человеком. CustDev (Customer Development) — процесс проверки бизнес-гипотез через разговоры с реальными людьми: подтверждается ли спрос, есть ли у клиента та боль, под которую вы делаете продукт. UX-исследование — изучение того, как человек на самом деле пользуется продуктом, где спотыкается, что его раздражает.
Что общего на этапе обработки
На выходе у всех трёх форматов одно и то же: серия аудиозаписей живой русской речи. И с этой горой записей предстоит сделать ровно одно — расшифровать, разметить по говорящим и проанализировать. Поэтому дальше неважно, CustDev у вас или UX-ресёрч: этап обработки выглядит одинаково.
Как расшифровать интервью в текст: три способа
Путей всего три. Разберём каждый честно — с минусами.
Вручную
Сесть и расшифровать самому — нормальный вариант, если у вас одно-два коротких интервью. Вы держите контекст в голове, ничего никому не передаёте. Но как только речь о серии, ручная расшифровка превращается в марафон из пауз, перемоток и переслушиваний. Это долго и быстро выматывает.
Транскрибатор-фрилансер
Можно нанять человека. Это снимает рутину с вас, но появляются деньги и сроки — серию мгновенно никто не сделает. И есть вопрос, который часто упускают: куда уходят ваши записи? В интервью звучат имена, контакты, личные истории живых людей. Передавая аудио постороннему, вы доверяете ему эти персональные данные — и не всегда понятно, кто их слушает и где они потом хранятся.
Автоматический сервис
Автоматический сервис — это быстро: загрузили запись, через какое-то время получили текст. Так работает автоматическая транскрибация интервью — программа сама превращает речь в текст. Но здесь критичны две вещи. Первая — качество именно русского языка: многие зарубежные сервисы распознают русскую речь с ошибками. Вторая — приватность: что происходит с вашими записями после загрузки и где они обрабатываются.
Сразу честная оговорка: автоматическая расшифровка — это работа искусственного интеллекта, и в ней бывают ошибки. Важный текст и ключевые цитаты стоит перечитать и сверить с записью, особенно если потом вы будете на них ссылаться. Подробнее про сам процесс — в гайде про транскрибацию аудио в текст.
Подытожим. Исследователю важны три вещи разом: сильный русский язык, разделение по говорящим и безопасность данных. Дальше разбираем каждую по отдельности.
Диаризация: кто сказал — модератор или респондент
Это смысловой центр всей темы. Если коротко: без разделения по говорящим расшифровка интервью почти не имеет смысла.
Что такое диаризация
Диаризация — это когда в расшифровке видно, кто из участников произнёс каждую реплику. Звучит технически, а на деле всё просто: текст перестаёт быть сплошным полотном и распадается на «сказал один человек», «ответил другой». Без этого вопросы и ответы слипаются, и чтобы понять, где речь респондента, приходится вспоминать ход беседы по памяти. А для анализа вам нужны именно ответы собеседника — отдельно от ваших вопросов.
Как это ускоряет анализ
Сонар делает диаризацию автоматически. Движок — российская модель распознавания речи GigaAM v3, заточенная под русский язык; диаризация спикеров работает на проде. В расшифровке видно, где реплика одного участника, а где другого — не нужно вручную проставлять, кто говорит. Вы открываете текст и сразу понимаете, где спрашивал исследователь, а где отвечал собеседник. Та же логика разметки по говорящим работает и в других сценариях — например, когда из живого разговора собирается понятный протокол совещания, — только здесь она настроена под задачи ресёрчера.
Фокус-группы и интервью с несколькими участниками
Если у вас не один на один, а фокус-группа или интервью с несколькими собеседниками, разделение по говорящим спасает вдвойне — иначе в стене текста невозможно разобраться, кто из участников что сказал. Когда реплики размечены, гораздо легче не запутаться и проследить ход обсуждения.
От расшифровки к инсайтам: поиск, саммари и папки
Текст готов — но это ещё не выводы. Большинство сервисов на этом и останавливаются: «вот ваша расшифровка». А исследователю нужно дальше — от текста к инсайтам.
Поиск по всем расшифровкам вместо переслушивания
Главная боль после серии интервью звучит так: «кто-то из респондентов упоминал вот эту проблему, но кто и где?» Чтобы найти, обычно приходится переслушивать часы аудио. Поиск по всему архиву закрывает это: набираете ключевое слово — и видите все реплики по всей серии, где тема всплывала. В Сонаре есть и полнотекстовый, и смысловой поиск, так что находятся даже близкие по смыслу формулировки. Без перемоток и переслушиваний.
Краткое ИИ-саммари каждого интервью
К каждой записи Сонар делает краткое саммари — короткую выжимку беседы. Это помогает быстро вспомнить, о чём вообще был разговор, не открывая полный транскрипт на несколько страниц. Удобно, когда вы возвращаетесь к интервью спустя пару недель. Здесь та же оговорка: саммари — работа ИИ, и для важных выводов первоисточник всё равно стоит перечитать. Подробнее про то, как устроены такие выжимки, — в разборе саммари встречи.
Папки по проектам и волнам исследования
Серию интервью удобно держать в одной папке проекта, а разные волны исследования раскладывать по своим папкам. Всё под рукой, ничего не теряется, и не приходится вспоминать, в каком файле лежала нужная беседа.
Фиксация договорённостей и follow-up
Сонар умеет вытаскивать из разговора задачи и договорённости. Для исследователя это мягкая, но приятная мелочь: если вы пообещали респонденту прислать результаты или договорились что-то проверить, такие пункты помогают не потерять follow-up по итогам беседы.
Важно понимать границу. Инструмент помогает находить и сопоставлять — поиск, саммари, папки, — но он не собирает за вас отчёт в один клик и не раскладывает темы по полочкам сам. Финальный синтез, выводы и инсайты остаются за исследователем. Рабочий цикл выглядит так: провели серию — все расшифровки в папке проекта — ищете повторяющиеся темы по словам — саммари освежает каждую беседу — а выводы собираете вы.
Конфиденциальность данных респондентов и 152-ФЗ
Это та тема, мимо которой профессиональному исследователю проходить нельзя. Вы работаете с персональными данными живых людей, и важно понимать, куда они уходят.
Почему зарубежный сервис — это риск
В записях интервью звучат имена, контакты, личные истории — это персональные данные. Когда вы загружаете такую запись в зарубежный сервис, файл уходит за границу, на чужие серверы, вне вашего контроля. Для исследователя, который отвечает за данные своих респондентов, это вполне ощутимый риск.
Обработка на сервере в России
Сонар обрабатывает записи на собственном сервере в России, на своих моделях. Аудио и транскрипты лежат в российском дата-центре, данные не уходят за рубеж — это снимает риск по 152-ФЗ. Для ниши, которая постоянно имеет дело с персональными данными людей, это не мелочь, а одно из основных условий выбора инструмента.
Согласие респондента: что изменилось
Записывать интервью с другими людьми нужно с их согласия — это базовое правило вежливости и закона. И ещё момент, о котором стоит знать: с 1 сентября 2025 года (ФЗ № 156-ФЗ от 24.06.2025) согласие на обработку персональных данных оформляется отдельным документом. Это касается и записи интервью с респондентами. Подробнее про устройство хранения и закон — в разборе безопасности данных и 152-ФЗ.
Оговорка: статья носит ознакомительный характер и не является юридической консультацией. Факт «обработка идёт на сервере в России, данные не уходят за рубеж» подтверждён, но всё соответствие требованиям закона одна программа за вас не закроет — по конкретной ситуации лучше показаться профильному юристу.
Где удобно записывать и расшифровывать: iPhone, Apple Watch, веб-кабинет и бот
Теперь о практике — чем записывать и где обрабатывать. У Сонара две грани, и обе настоящие.
Запись офлайн-интервью с iPhone или Apple Watch
Логично спросить: а нельзя ли обойтись встроенным Диктофоном iPhone? С русской речью — нельзя. Apple официально не поддерживает расшифровку русского во встроенных Диктофоне и Заметках iPhone и на Apple Watch. Поэтому для русскоязычных интервью нужен отдельный инструмент. Подробный разбор — в статье про диктофон на iPhone и Apple Watch.
Сонар — нативное приложение для iPhone и Apple Watch: живую встречу можно записать прямо с телефона, и разговор сразу превращается в текст на русском. Удобно, когда интервью проходит лицом к лицу. Smart-запись не пишет тишину и долгие паузы — в архиве остаётся только полезное.
Онлайн-интервью и созвоны: бот-участник или загрузка файла
Для онлайн-интервью есть два пути. Первый — пригласить в созвон бота Сонара по invite-ссылке: он заходит в Яндекс Телемост, Zoom или Google Meet как участник, а после встречи вы получаете расшифровку, саммари, задачи и тайм-коды (Microsoft Teams — в роудмапе). Второй — если запись уже есть, готовый аудиофайл созвона можно загрузить в веб-кабинет, и он расшифруется так же. Выбираете то, что удобнее под конкретное интервью.
Анализ расшифровок в браузере
Анализ удобнее вести в браузере на компьютере: открыть расшифровки на большом экране, искать по репликам, читать саммари, раскладывать по папкам. Записали с телефона или загрузили файл — проанализировали за компьютером. Веб-кабинет открывается в любом браузере.
Сонар против Otter.ai и API для разработчиков
Коротко и честно — чем Сонар отличается от того, что обычно советуют русскоязычному исследователю.
Чем Сонар отличается от Otter.ai
Otter.ai — популярный сервис, но для русских интервью у него две большие проблемы. Во-первых, слабый русский: распознаёт с ошибками, да и интерфейс на английском. Во-вторых, оплата: российскую карту он не принимает. Сонар закрывает обе боли — русский из коробки на модели GigaAM v3, оплата обычной российской картой, обработка в России. Полное сравнение — в разборе Сонар против Otter.ai.
Вот как это выглядит рядом:
| Что важно исследователю | Сонар | Otter.ai |
|---|---|---|
| Русский язык | из коробки | слабый, с ошибками |
| Оплата картой РФ | да | нет |
| Где обрабатываются данные | сервер в России | за рубежом |
| Платформы | iPhone, Apple Watch, веб, бот в созвоне | в основном веб |
| Диаризация | да, автоматически | есть |
| Поиск по записям и папки | в одном месте | ограниченно |
Готовый инструмент против API
Иногда советуют SaluteSpeech от Сбера или Yandex SpeechKit. Это хорошие технологии, но важная оговорка: это API для разработчиков, а не готовый инструмент. Чтобы ими пользоваться, нужен программист, который всё подключит и соберёт интерфейс. Исследователю, который хочет просто загрузить запись и получить размеченный текст, без отдельной разработки они не подойдут. Если интересно посмотреть на готовые сервисы рядом, есть отдельный обзор нейросетей для расшифровки 2026.
Оплата российскими картами
Отдельно подчеркнём то, что для российского исследователя часто решает: оплата проходит обычной российской картой, через СБП или ЮMoney, и вся обработка идёт без зарубежных сервисов. Не нужно искать обходные пути для оплаты и переживать, где окажутся записи.
Тарифы Сонара
Чтобы проверить на своих интервью, начать можно бесплатно, а дальше выбрать тариф под объём записей.
| Тариф | Цена | Минут в месяц |
|---|---|---|
| Старт | 0 ₽ | 120 |
| Рабочий | 490 ₽/мес | 1200 |
| Профи | 1490 ₽/мес | 4000 |
Годовая оплата идёт со скидкой. Платить можно российской картой, через СБП или ЮMoney. Актуальные условия всегда на странице тарифов.
Как начать: расшифровать первое интервью
Чтобы не откладывать — вот простой путь из трёх шагов:
- Записать или загрузить. Запишите интервью прямо с iPhone или Apple Watch, пригласите бота в онлайн-созвон или загрузите готовый аудиофайл в веб-кабинет.
- Расшифровать. Получите текст с разделением по говорящим и краткое саммари беседы.
- Проанализировать. Сложите расшифровку в папку проекта, ищите нужные реплики по всей серии и опирайтесь на выжимку, когда нужно быстро вспомнить разговор.
Частые вопросы
Можно ли расшифровать интервью с разделением на модератора и респондента?
Да. Сонар делает диаризацию автоматически — в расшифровке видно, кто из участников произнёс каждую реплику, так что вопросы исследователя и ответы собеседника не слипаются в одну стену текста. Это удобно и для разговоров один на один, и для фокус-групп с несколькими участниками.
Что лучше расшифровывает русскую речь — Сонар или Otter.ai, и можно ли оплатить картой РФ?
Сонар заточен под русскую речь и работает с ней из коробки на российской модели GigaAM v3, тогда как Otter.ai распознаёт русский с ошибками и имеет интерфейс на английском. Плюс Otter.ai не принимает российскую карту, а в Сонаре оплата обычной российской картой, через СБП или ЮMoney доступна.
Куда уходят записи интервью с персональными данными и соответствует ли это 152-ФЗ?
Сонар обрабатывает записи на собственном сервере в России, на своих моделях — аудио и транскрипты лежат в российском дата-центре, данные не уходят за рубеж, что снимает риск по 152-ФЗ. Статья при этом ознакомительная и не заменяет юридическую консультацию: полное соответствие закону одна программа за вас не закроет.
Можно ли обработать онлайн-интервью или созвон?
Да, и двумя способами. Можно пригласить бота Сонара в созвон по ссылке — он заходит в Яндекс Телемост, Zoom или Google Meet как участник и после встречи отдаёт расшифровку и саммари. А если запись уже есть, готовый аудиофайл можно просто загрузить в веб-кабинет, и он расшифруется так же.
Как искать нужные реплики по серии интервью, не переслушивая записи?
Есть поиск по всему архиву сразу — и полнотекстовый, и смысловой: набираете ключевое слово, и видите все реплики по всей серии, где тема всплывала. Не нужно переслушивать часы аудио, чтобы вспомнить, кто из респондентов упоминал конкретную боль.
Нужно ли согласие респондента и что изменилось с 1 сентября 2025 года?
Записывать интервью с другими людьми нужно с их согласия. С 1 сентября 2025 года (ФЗ № 156-ФЗ от 24.06.2025) согласие на обработку персональных данных оформляется отдельным документом — это касается и записи интервью с респондентами. Это не юридическая консультация: за точной формулировкой документа лучше обратиться к юристу.
Можно ли записать интервью на iPhone или Apple Watch, если встроенный Диктофон не расшифровывает русский?
Да. Apple официально не поддерживает расшифровку русской речи во встроенных Диктофоне и Заметках iPhone и на Apple Watch, поэтому для русскоязычных интервью нужен отдельный инструмент. Сонар работает на iPhone и Apple Watch и сразу превращает разговор в текст на русском, а обрабатывать расшифровки удобно в браузере на компьютере.
Что почитать дальше
- Расшифровка интервью в текст — базовый разбор процесса с разделением по говорящим.
- Безопасность данных и 152-ФЗ — где хранятся записи и что важно для закона.
- Сонар против Otter.ai — подробное сравнение для русскоязычных пользователей.
- Транскрибация аудио в текст — как работает автоматическая расшифровка.
- Саммари встречи — как устроены краткие выжимки беседы.
- Лучшие нейросети для расшифровки 2026 — обзор готовых сервисов рядом.