Det här var ett R&D-projekt som utforskade webbläsarbaserad ljudbearbetning med Web Audio API. Målet var att detektera och segmentera tal direkt i webbläsaren utan att skicka något till en server—all bearbetning sker lokalt.
Vi byggde ett JavaScript-bibliotek som kunde identifiera när någon pratade, segmentera talet i användbara bitar, och hantera allt i realtid. Det knepiga var att göra det tillräckligt performant för att köra smidigt över olika webbläsare och enheter.
Tekniken fungerade tillräckligt bra för att fånga uppmärksamhet från ett amerikanskt företag som jobbar med kommersiella röstprodukter. De förvärvade projektet och integrerade det i sin plattform. Det är ett av de där projekten där forskningsfasen blev till något faktiskt användbart.
