Sistema de reconocimiento automático de voz ASR

Sistema de reconocimiento automático de voz ASR

US$ 100,00 1 Pieza (MOQ)
Puerto:
Guangzhou, China
Condiciones de Pago:
T/T

Última Fecha de Inicio de Sesión:

Oct 29, 2024

Tipo de Negocio:

Fabricante/Fábrica

Productos Principales:

El equipo de sala de conferencias

Buscar productos similares

Descripción de Producto

Información de la Compañía

Descripción de Producto

El sistema de reconocimiento automático de voz GONSIN se adapta a varios escenarios de aplicación, como actas de reuniones, registros de formación, subtítulos de voz en tiempo real, transcripción de registros de entrevistas, Registros de juicios en tiempo real, etc. puede combinar el texto y la grabación de voz de cada rol, combinar y generar actas de reunión, y apoyar la exportación de texto. El sistema de conferencias China admite la implementación de alquiler de servidores en la nube, y la implementación de LAN de servidores locales, el aprendizaje de inteligencia artificial y la optimización continua del sistema.

Como nuevo desarrollo de soluciones modernas de conferencias, el sistema de reconocimiento automático de voz (ASR) aporta una experiencia de interacción humano-informática más inteligente.para las conferencias tradicionales, la comunicación por sonido y vídeo no puede satisfacer las necesidades de la conferencia moderna. Además, después de la reunión, el procesamiento de documentos, las actas de las reuniones y los procedimientos legales de usuarios específicos también deben presentarse en formato de palabras. El sistema de reconocimiento automático de voz de Gonsin puede lograr la transcripción de texto en tiempo real, completa y ordenada a partir del sonido, y asegura que el texto se corresponde con el discurso de cada delegado. El texto transcrito puede ser mostrado en una pantalla grande, así como Gonsin sistema de conferencias en tiempo real.

El sistema ASR se adapta a varios escenarios de aplicación, como actas de reuniones, registros de formación, subtítulos de voz en tiempo real, transcripción de registros de entrevistas, registros de juicios en tiempo real, etc.

Soluciones de sistema de reconocimiento de voz automático Gonsin
El sistema GONSIN ASR ofrece tres soluciones: Reconocimiento de voz en línea y solución de traducción, solución de implementación privada ligera y solución de implementación privada de clúster de sala de conferencias.

Solución de reconocimiento y traducción de voz en línea

Solución de implementación privada ligera

Solución de implementación privada de clúster de sala de conferencias

Ventajas del sistema de reconocimiento automático de voz
El sistema de software de reconocimiento automático de voz GONSIN se desarrolla en la plataforma de la tecnología de reconocimiento automático de voz de conferencia digital completa GONSIN. Al conectar los datos de audio de red y el fondo ASR, y en el apoyo de ASR y GONSIN software de aplicación, realiza transcribir voz en tiempo real en texto.

Software de reconocimiento automático de voz Gonsin V7,1.0
Funciones básicas
Admite la nube pública y el acoplamiento de selección de servidor de voz en nube propietario, que puede cumplir diferentes métodos de implementación de servidores. Admitir la instalación en PC o servidor de reconocimiento de voz, que se puede aplicar de forma flexible a una variedad de escenarios de aplicación.

Admite la función de administración de cierre del servidor ASR, el servidor ASR, la conexión del sistema de discusión, la búsqueda y la función de personalización de funciones de micrófono, y admite la carta pública de cada serie de sistemas de discusión acoplamiento, administración de conferencias, separación de funciones e identificación automática.

Gestión del personal y el equipo de soporte, incluida la búsqueda de equipos, la visualización de información de número de unidad, información de dirección IP y configuración de nombre de personal; la edición de información de la reunión de soporte, incluida la nueva cita, la definición de la hora, la ubicación y la edición del contenido de la reunión.

Admite el reconocimiento simultáneo de múltiples funciones de micrófono y la función antidiafonía, que puede evitar de forma eficaz la diafonía mutua cuando se reconocen varios micrófonos al mismo tiempo; admite mensajes de estado de micrófono, que pueden mostrar el estado de activación y desactivación del micrófono en tiempo real.

Apoyar la función de aprendizaje de modelos de lenguaje. Admite la importación de palabras comunes como nombres de personas y lugares para aprender el modelo de idioma.
Apoyar la identificación automática de los roles de los participantes, la identificación automática de la voz de los participantes y la transcripción en texto. El software asr admite la traducción a otras funciones de voz necesarias (las funciones de software varían según las capacidades del motor)

Apoyar la comprensión semántica inteligente, que puede comprender automáticamente la semántica de los participantes y automáticamente romper frases y segmentos de acuerdo con la semántica. Apoyar la conversión automática de números consecutivos al formato árabe, y apoyar la identificación automática de números de teléfono celular, tarjetas de identificación y otros números consecutivos convertidos al formato árabe.

Apoyar funciones de edición y corrección de texto de reunión. Genere archivos de grabación independientes para diferentes roles o combine los registros de texto y las grabaciones de cada rol. Las grabaciones de voz y texto se pueden sincronizar con la reproducción y visualización de la corrección de documentos.

Admitir la función de salida de registros de reuniones. Admitir la combinación de texto, generar actas de reunión y exportar texto.

Admite la función de búsqueda de contenido, admite la búsqueda de contenido de texto. Las palabras clave pueden ser buscadas, localizar rápidamente la posición del contenido correspondiente, mejorando en gran medida la eficacia de la recuperación de contenido.

Admite la función de salida de pantalla dividida de texto. Instalación en el ordenador, puede realizar la transcripción texto en tiempo real de la pantalla principal del ordenador operativo, apoyar la expansión de la salida de pantalla dividida, visualización en tiempo real del contenido de texto del reconocimiento de voz. Admite la función de personalización de pantalla, la resolución de pantalla adaptable, la fuente de texto de soporte, los ajustes de tamaño, para proporcionar un servicio de visualización de texto de pantalla dividida de alta calidad.

Admitir el reconocimiento de archivos de grabación, a través de la importación de archivos de grabación, convertir automáticamente el contenido del archivo de grabación en contenido de texto; admitir mp3, wav y otros formatos de archivo.

Admite la selección de dispositivos de entrada de audio, puede conectar los dispositivos de entrada de audio del ordenador, texto de transcripción de entrada de audio en tiempo real

Soporte para que el equipo reconozca el contenido de sonido de reproducción actual y lo convierta automáticamente en texto.

Soporte de características más personalizadas: El software soporta la conmutación en chino e inglés, así como otros lenguajes personalizados; soporte para el desarrollo secundario, de acuerdo con los requisitos del proyecto del protocolo de interfaz abierta o desarrollo personalizado.

Software de reconocimiento automático de voz Gonsin V7,1.0
Funciones básicas
Buena compatibilidad del sistema, compatible con la visualización de subtítulos para dispositivos Windows y Android.

Admite varios ajustes de modo de visualización de subtítulos. Admite el modo de pantalla completa y el modo emergente

Modo de pantalla completa: Muestra el contenido de la transcripción en pantalla completa en forma de cuadro de diálogo. Admite la configuración de fondo y la configuración de fuente.

Modo Barrage: Muestra el contenido de la transcripción en un estilo de barrera flotante. Admite la configuración de línea y de fuente

Función de subtítulos de superposición de vídeo: Admite la función de subtítulos en tiempo real superpuesta en la pantalla de vídeo, integrada con aplicaciones de videoconferencia y seguimiento de cámara.

Soporte de la función de subtítulos de superposición sin papel: Permite la superposición de subtítulos en tiempo real en pantallas sin papel, la integración con sistemas sin papel, y la visualización de texto transcrito en tiempo real en terminales sin papel.

Servidor de reconocimiento de voz automático inteligente ligero
Funciones básicas
Con el software de reconocimiento de voz inteligente, puede realizar la gestión del acceso web

Apoyar el reconocimiento automático de los roles de los participantes, el reconocimiento automático de la voz de los participantes y la transcripción en texto

Con el motor ASR integrado, adopte la tecnología de reconocimiento de voz en línea líder del sector, implementada a través de la nube para proporcionar servicios de reconocimiento de voz para la voz local. Baja latencia, alta precisión de reconocimiento, la tasa de precisión puede alcanzar más del 99%

El servidor de reconocimiento de voz puede realizar la transcripción de voz de diferentes canales:

GX-AS201: Admite la capacidad de reconocimiento de voz de 1 vías

GX-AS202: Admite la capacidad de reconocimiento de voz de 2 vías

GX-AS205: Admite la capacidad de reconocimiento de voz de 5 vías

GX-AS208: Admite la capacidad de reconocimiento de voz de 8 vías

Admite reconocimiento de idiomas personalizado, como chino, inglés, español, árabe, Ruso y francés.

Apoyo al reconocimiento en múltiples escenarios de aplicación: Educación, judicial, médico, conferencia de voz, medios de comunicación, vídeo de entretenimiento, hogar inteligente, social, automoción, etc.

Admite varias salas de conferencias para compartir el servidor. Admite varias salas de conferencias en el centro de conferencias para formar una LAN e implementa de forma centralizada el servidor para cumplir con el reconocimiento de voz y la transcripción en paralelo en varias salas de conferencias.

Con el software de visualización de subtítulos de reconocimiento de voz inteligente, proporciona un servicio de visualización de subtítulos para conferencias.

Servidor de reconocimiento automático de voz ASR GX-AS301
Funciones básicas
Servidor estándar montado en bastidor 2U con rendimiento estable y fiable, adoptando placa de acero galvanizado SGCC, pintura exterior ecológica, resistencia a las huellas dactilares y resistencia al contacto 4kV fuerte interferencia magnética

Adopte un servidor LINNUX de configuración de alto rendimiento, instale el software ASR Engine V3,0 para realizar la identificación automática de los roles de los participantes, el reconocimiento automático de las voces de los participantes y la transcripción en texto.

Admite varias salas de conferencias para compartir el servidor. Admite varias salas de conferencias en el centro de conferencias para formar una LAN e implementa de forma centralizada el servidor para satisfacer las necesidades de varias salas de conferencias para el reconocimiento y la transcripción de voz en paralelo.

Colabore con el software de visualización de subtítulos de reconocimiento de voz inteligente para proporcionar servicio de visualización de subtítulos para reuniones

Modelo CTC de alta eficiencia, mediante la autorización opcional, un solo servidor admite un máximo de 50 reconocimientos simultáneos.

El servidor adopta un mecanismo de cifrado SSL para garantizar de forma eficaz la seguridad de almacenamiento y la seguridad de transmisión de la información confidencial. Los algoritmos de cifrado RC4, MD5 y RSA se utilizan para garantizar la seguridad de los datos de la plataforma y evitar la filtración de información importante.

Software integrado de administración de energía. Puede controlar el estado de la tensión para evitar fallos en el equipo causados por fluctuaciones de tensión y realizar protección contra todo tipo de condiciones climáticas.

Motor de reconocimiento automático de voz GONSIN V3,1/v3,2
Con tecnología de reconocimiento de voz en línea líder del sector, implementada a través de la nube para proporcionar servicios de reconocimiento de voz para voz local. Baja latencia, alta precisión de reconocimiento, la tasa de precisión puede alcanzar más del 99%

El motor adopta un modelo de pago por paquetes, reduciendo de manera efectiva el costo de entrada y el umbral de construcción del reconocimiento de voz. Los usuarios pueden adquirir el programa de paquetes de la duración adecuada en función de la demanda real de la duración del reconocimiento de voz (por favor, adquiera el servicio de paquetes a tiempo para garantizar el uso normal del motor)

Apoyo reconocimiento separado por roles: Diferentes idiomas originales y idiomas de traducción pueden ser seleccionados de acuerdo a diferentes roles, para realizar reconocimiento simultáneo de múltiples idiomas, transcripción en el texto correspondiente, y traducción.

Admite varios idiomas principales, como chino, inglés, francés, ruso, Árabe y español.

Con el software de visualización de subtítulos de reconocimiento de voz inteligente, puede mostrar el texto original y el texto traducido al mismo tiempo, o configurar para mostrar el texto original/traducido por separado, proporcionando servicio de subtítulos para la negociación de negocios y videoconferencia en diferentes idiomas.


Motor de reconocimiento automático de voz GONSIN V3,0
Adoptar una tecnología de modelo de reconocimiento de lenguaje inteligente, basada en la tecnología de IA para lograr el reconocimiento de voz

Admite reconocimiento de idiomas personalizado, como chino, inglés, español, árabe, Ruso y francés

Apoyo al reconocimiento en múltiples escenarios de aplicación: Educación, judicial, médico, conferencia de voz, medios de comunicación, vídeo de entretenimiento, hogar inteligente, social, automoción, etc.

Cualquier software de reconocimiento de voz automatizado, independientemente de su complejidad, puede extraer y descomponer sus palabras para análisis y respuesta, y su secuencia de eventos básica se enumera de la siguiente manera:

1.Hable con el software a través de la entrada de audio.

2.el reconocimiento automático de voz con el que está hablando generará un archivo de ondas de sus palabras.

3.los archivos de forma de onda se limpiaron eliminando el ruido de fondo y el volumen normalizado.

4.las formas de onda filtradas se descomponen en los llamados fonemas. (Los fonemas son los componentes básicos del lenguaje y la pronunciación de palabras. Hay 44 palabras en inglés, que consisten en bloques vocales como "wh", "th", "ka", y "t").

5.cada fonema actúa como una cadena, comenzando con el primer fonema y analizándolos en secuencia, y el reconocedor del habla ASR utiliza análisis probabilístico estadístico para inferir la palabra completa, y luego inferir frases completas desde allí.

6.su software de reconocimiento automático de voz ASR, que ahora "entiende" sus palabras, puede responder a usted de una manera significativa.

¿Cómo funciona el software de reconocimiento automático de voz?
Cualquier software de reconocimiento de voz automatizado, independientemente de su complejidad, puede extraer y descomponer sus palabras para análisis y respuesta, y su secuencia de eventos básica se enumera de la siguiente manera:

1.Hable con el software a través de la entrada de audio.

2.el reconocimiento automático de voz con el que está hablando generará un archivo de ondas de sus palabras.

3.los archivos de forma de onda se limpiaron eliminando el ruido de fondo y el volumen normalizado.

4.las formas de onda filtradas se descomponen en los llamados fonemas. (Los fonemas son los componentes básicos del lenguaje y la pronunciación de palabras. Hay 44 palabras en inglés, que consisten en bloques vocales como "wh", "th", "ka", y "t").

5.cada fonema actúa como una cadena, comenzando con el primer fonema y analizándolos en secuencia, y el reconocedor del habla ASR utiliza análisis probabilístico estadístico para inferir la palabra completa, y luego inferir frases completas desde allí.

6.su software de reconocimiento automático de voz ASR, que ahora "entiende" sus palabras, puede responder a usted de una manera significativa.
Para obtener más información sobre la herramienta de reconocimiento de voz automatizado y    el equipo de sala de conferencias, no dude en ponerse en contacto con nosotros.
 
Dirección: 11th Floor, Block 2, Jinyuehongtai Building, No. 4 Chengye Road, Fengxiang Industrial Park, Foshan, Guangdong, China
Tipo de Negocio: Fabricante/Fábrica
Rango de Negocios: Agricultura y Alimento
Productos Principales: El equipo de sala de conferencias
Introducción de Empresa: GONSIN es el proveedor global de soluciones de sistema completo de la conferencia, incluyendo la discusión de la conferencia system, sistema de votación, la interpretación simultánea system, sistema de conferencia sin papeles, el sistema ASR, sistema de software de gestión de conferencias, conexión a Internet de base + Sistema de gestión, registro de asistencia system, sistema de control central, sistema de megafonía, para la educación sistema de megafonía, etc..
Enviar directamente tu consulta a este proveedor

Publique Solicitud de Compra Ahora