Бесплатно — до 2 проверок в час с одного IP

Детектор музыкальных жанров, который реально видит разницу между deep house и tech house.

Запишите любую песню рядом или загрузите MP3 — мы назовём жанр, поджанр, BPM и настроение. На нашем собственном аудио-ИИ, обученном и поддерживаемом внутри команды. До 96% точности на GTZAN и MagnaTagATune.

последнее обновление 200+ жанров и поджанров~3 сек на анализ
Живой детектор
Определить жанр

Войди, чтобы определить — попробуй бесплатно

или загрузи файл
Deep House
поджанр · Melodic House & Techno · 122 BPM
уверенность 94%эйфорияночная ездаA минор
// почему это точно

На реальных исследованиях, а не на ощущениях.

Мы сами создаём и обучаем свою аудио-модель — в паре с таксономией из 500+ жанров, которую годами собирали по реальным данным. Никаких догадок, никаких костылей на основе чартов.

96%

Эталонная точность

На GTZAN и MagnaTagATune мы выдаём 91–96% top-1 в зависимости от семейства жанров. Мы тестируем на GTZAN и MagnaTagATune и приводим цифры, которые измерили сами.

Анализ за ~3 секунды

Запишите 10 секунд — получите результат за три. Инференс идёт на нашем GPU-сервере; ваш исходный звук нигде не сохраняется.

🎛

Поджанры, а не корзины

«Электроника» — слишком широко. Мы отделяем Deep House от Tech House, Drum & Bass от Liquid DnB, Phonk от Drift Phonk.

🎧

Детект BPM и тональности

Анализ ритм-сетки даёт темп с точностью до ±1 BPM и тональность в 24 классах — полезно диджеям при подготовке сета или продюсерам в поиске референсов.

🌐

Без регистрации и рекламы

Три бесплатных анализа в браузере, чтобы попробовать, а дальше — безлимит в мобильном приложении. Мы не крутим рекламу и не продаём ваши данные. Обещание письменно зафиксировано на странице «О нас».

📈

Вектор настроения

12-мерное считывание настроения: энергичное, меланхоличное, обнадёживающее, тёмное, мечтательное, танцевальное, агрессивное… Те же данные, на которых работает «найти похожие треки» в приложении.

// три шага

Как это работает.

01

Нажмите на микрофон или бросьте файл.

Нам нужно около 10 секунд звука. Браузер попросит доступ к микрофону; при загрузке файла мы читаем буфер локально — ваш звук не покидает вкладку, пока вы не запустите анализ.

02

Наша модель считывает звук.

Звук обрабатывает наша собственная модель — обученная на миллионах размеченных треков по 500+ жанровым категориям. Она оценивает все жанры одновременно и переранжирует результат тонко настроенной головой, обученной на отобранных реальных данных.

03

Жанр, поджанр, BPM, настроение — за 3 сек.

Вы получаете верхний ярлык с оценкой уверенности, ближайшие жанры на случай гибрида и разбор BPM/тональности/настроения. Сохраните в избранное, поделитесь ссылкой на результат или анализируйте дальше.

// посмотреть таксономию

Несколько из 200+ жанров, что мы знаем.

Нажмите на любой чип, чтобы увидеть примеры треков, которые наш детектор нашёл в дикой природе.

+ ещё 174 поджанра
/* как это устроено */

Наша собственная модель. Создана для музыки, а не позаимствована.

Большинство детекторов жанра переиспользуют общие аудио-эмбеддинги. Мы пошли другим путём — обучили выделенную модель на миллионах размеченных треков и тонко настроили её именно под детализацию поджанров. Поэтому она отделяет Deep House от Tech House, Drum & Bass от Liquid DnB, Phonk от Drift Phonk. Мы тестируем на GTZAN и MagnaTagATune и приводим цифры, которые измерили сами.

// вопросы, по большей части реальные

FAQ.

Shazam сопоставляет аудио-отпечаток со своим каталогом известных треков. Если песни в каталоге нет (DJ-эдит, бутлег, релиз, купленный на Bandcamp), он сдаётся. Мы не пытаемся опознать песню — мы слушаем и говорим, что это за музыка. Так что и виниловый рип 1996 года, и вчерашняя заливка на SoundCloud — оба пройдут анализ.
Да. Три бесплатных анализа в браузере, без регистрации. GPU-сервер мы оплачиваем из выручки по подпискам в мобильном приложении. Если нужно больше — приложение для iOS/Android даёт безлимит за цену чашки кофе в месяц.
Подойдёт всё — от записи на микрофон телефона в шумном баре до lossless-WAV. Чем чище звук, тем выше точность: на MP3 128 кбит/с вы всё равно получите ~88% на бенчмарке GTZAN; на 320 кбит/с или lossless мы держим 94%+.
Нет. Мы держим звук в памяти ровно столько, сколько нужно для прохода эмбеддинга, потом удаляем. Результат (жанр + BPM + настроение) записывается под ID результата, чтобы вы могли им поделиться; исходный звук — нет.
В этом весь смысл. В нашей таксономии 200+ листьев, а классификационная голова была тонко настроена именно на различение близких пар. Вы получите top-1 поджанр с уверенностью и ближайших конкурентов для спорных треков.
Треки на стыке жанров действительно неоднозначны — песня, которая на 60% Trap и на 40% Phonk, получит ту или иную метку в зависимости от того, какое вступление вы записали. Мы показываем уверенность и ближайших конкурентов, чтобы вы видели, когда модель не уверена. Для совсем маргинального (drone, free jazz, microsound) таксономия пока недостаточно глубока.
Публично пока нет. Если вы DJ-пул, музыкальная библиотека или B2B-партнёр с реальной задачей — напишите, и мы обсудим цены.

Хватит называть всё подряд «хаусом».

Бесплатно в браузере. Безлимит в приложении.

Скачать на iOS →Скачать на Android →
Бесплатный онлайн-детектор музыкальных жанров — Genre AI