Un detector de gèneres musicals que de debò sap la diferència entre deep house i tech house.
Grava qualsevol cançó que tinguis a prop o puja un MP3 — et direm el gènere, el subgènere, els BPM i l'estat d'ànim. Impulsat per la nostra pròpia AI d'àudio — entrenada i mantinguda internament. Fins a un 96% de precisió amb GTZAN i MagnaTagATune.
Feta amb recerca de debò, no amb intuïcions.
Construïm i entrenem el nostre propi model d'àudio — combinat amb una taxonomia de més de 500 gèneres que hem curat a partir d'anys de dades del món real. Sense conjectures, sense dreceres basades en rànquings.
Precisió de referència
Amb GTZAN i MagnaTagATune arribem al 91–96% de top-1, segons la família de gèneres. Fem el benchmark amb GTZAN i MagnaTagATune i reportem xifres que hem mesurat nosaltres mateixos.
~3 segons d'anàlisi
Grava 10 segons, obtén un resultat en tres. La inferència s'executa al nostre servidor GPU; el teu àudio en brut no es guarda mai.
Subgèneres, no calaixos
«Electrònica» és massa ampli. Nosaltres separem el Deep House del Tech House, el Drum & Bass del Liquid DnB, el Phonk del Drift Phonk.
Detecció de BPM i to
L'anàlisi de la graella rítmica et dona el tempo amb un marge de ±1 BPM i el to en 24 classes — útil per a DJ que preparen una sessió o productors que cerquen pistes de referència.
Sense registre, sense anuncis
Tres anàlisis gratuïtes al navegador per provar, i després il·limitades amb l'app mòbil. No posem anuncis ni venem les teves dades. Promès per escrit a la pàgina Sobre nosaltres.
Vector d'estat d'ànim
Lectura de l'estat d'ànim en 12 dimensions: enèrgic, melancòlic, esperançador, fosc, somiador, ballable, agressiu… Les mateixes dades que fem servir per impulsar «troba pistes similars» a l'app.
Com funciona.
Toca el micròfon o deixa anar un fitxer.
Necessitem uns 10 segons d'àudio. El navegador demana permís per al micròfon; en pujar un fitxer llegim el buffer localment — el teu àudio no surt de la pestanya fins que decideixes analitzar-lo.
El nostre model llegeix l'àudio.
L'àudio el processa el nostre model propietari — entrenat amb milions de pistes etiquetades en més de 500 categories de gèneres. Puntua tots els gèneres simultàniament i els torna a classificar amb una capa afinada entrenada amb dades curades del món real.
Gènere, subgènere, BPM, estat d'ànim — en 3s.
Obtens l'etiqueta principal amb una puntuació de confiança, els gèneres finalistes per si és un híbrid, i el desglossament de BPM/to/estat d'ànim. Desa-ho als preferits, comparteix un enllaç del resultat o analitza'n un altre.
Uns quants dels més de 200 gèneres que coneixem.
Toca qualsevol etiqueta per veure pistes d'exemple que el nostre detector ha trobat al món real.
El nostre propi model. Fet per a la música, no manllevat.
La majoria de detectors de gèneres reaprofiten embeddings d'àudio genèrics. Nosaltres vam triar un camí diferent — entrenar un model dedicat amb milions de pistes etiquetades, afinant-lo específicament per a la granularitat de subgèneres. Per això separa el Deep House del Tech House, el Drum & Bass del Liquid DnB, el Phonk del Drift Phonk. Fem el benchmark amb GTZAN i MagnaTagATune i reportem xifres que hem mesurat nosaltres mateixos.