DingTalk e o Laboratório Tongyi lançam o modelo personalizado de reconhecimento de voz Fun-ASR
Em 22 de agosto, o DingTalk e a equipa de voz do Laboratório Tongyi lançaram em conjunto o novo modelo de reconhecimento de voz Fun-ASR. Este modelo pode identificar com precisão termos técnicos de dez setores, incluindo construção e pecuária, e suporta treino personalizado de modelos exclusivos para empresas. Graças a uma cooperação profunda, o Fun-ASR consegue transcrever eficientemente vários sinais de voz, possuindo capacidades de compreensão de termos em múltiplos setores, reconhecimento de sotaques multilíngues e raciocínio semântico contextual.
O Fun-ASR já está integrado nos módulos de legendagem e tradução simultânea em reuniões do DingTalk, notas inteligentes e assistente de voz, entre outros, dedicando-se a construir uma base de reconhecimento de voz estável, eficiente e facilmente expansível, especialmente adequada para cenários empresariais que exigem alta precisão de reconhecimento e compreensão do contexto.
Pontos fortes da tecnologia: três capacidades fundamentais que sustentam um reconhecimento de alta precisão
O Fun-ASR foi treinado com centenas de milhões de horas de dados de áudio e, em conjunto com os dados reais de cenários do DingTalk em diversos setores como Internet, tecnologia, construção, pecuária e automóvel, melhorou significativamente a capacidade de reconhecimento de termos técnicos.
Resultados de testes mostram que a taxa de precisão de reconhecimento no setor de seguros aumentou em 18%, enquanto nos setores de construção e pecuária aumentou entre 15% e 20%. O modelo também suporta a função de palavras-chave personalizadas pelas empresas, podendo importar mais de 1000 termos exclusivos, reforçando a capacidade de reconhecer palavras raras.
O Fun-ASR pode combinar informações internas da empresa, como lista de contactos, agenda e base de conhecimento dentro do DingTalk, para otimizar o raciocínio. Após obter a autorização da empresa, reduz efetivamente as ilusões geradas por grandes modelos, produzindo resultados de transcrição mais confiáveis.
Com uma arquitetura eficiente de ponta a ponta, o modelo pode utilizar dados de voz reais fornecidos pela empresa para otimizar ainda mais o algoritmo, aumentando a precisão de reconhecimento de conteúdos exclusivos, como nomes de marcas, códigos de projetos, nomes de produtos e nomes de pessoas.
Tomando a Gujia Home como exemplo, após treino personalizado, o modelo consegue reconhecer com precisão expressões complexas como "látex Pulse importado da Bélgica" ou "processo de espuma Sonocore original", fornecendo uma base sólida para a análise posterior das necessidades dos clientes.
Perspetivas futuras: aprofundar continuamente a capacidade de adaptação ao setor
Li Xiangan, responsável pela equipa de voz do Laboratório Tongyi, afirmou: "Esperamos promover em conjunto com o DingTalk a aplicação inovadora da tecnologia de reconhecimento de voz em cenários empresariais. No futuro, continuaremos a expandir a escala de dados e modelos do Fun-ASR, melhorando a replicabilidade das soluções e proporcionando às empresas uma experiência mais inteligente e eficiente."
Zhu Hong, CTO do DingTalk, salientou: "Em apenas três meses de colaboração estreita, conseguimos implementar o modelo e obter o reconhecimento de clientes de topo. Este é um avanço crucial rumo à liderança no setor e também oferece um exemplo replicável para a personalização de grandes modelos para mais empresas."
Atualmente, o potencial do Fun-ASR continua a ser explorado, com ambas as partes a focarem-se na atualização das capacidades de reconhecimento de dialetos, robustez em ambientes ruidosos, suporte multilíngue e personalização profunda para empresas, elevando globalmente a precisão e a praticidade da transcrição de voz e ajudando mais empresas a alcançar uma atualização inteligente.
A DomTech é o fornecedor oficial designado do DingTalk em Macau, especializado em fornecer serviços do DingTalk aos clientes. Se desejar saber mais sobre as aplicações da plataforma DingTalk, pode consultar diretamente o nosso serviço de apoio ao cliente online ou contactar-nos através do telefone +852 95970612 ou do e-mail cs@dingtalk-macau.com. Temos uma excelente equipa de desenvolvimento e operação, com vasta experiência em serviços de mercado, capaz de lhe oferecer soluções e serviços profissionais do DingTalk!
Português
English