DeepSeek Modelos

  • El uso de Blackwell por DeepSeek pone a prueba la prohibición de exportación de EE. UU.

    El uso de Blackwell por DeepSeek pone a prueba la prohibición de exportación de EE. UU.

    Cómo el entrenamiento de DeepSeek con Blackwell pone a prueba el embargo estadounidense a los chips Estados Unidos intenta impedir con controles estrictos de exportación que empresas chinas accedan al hardware más avanzado para inteligencia artificial. El caso de DeepSeek muestra hasta qué punto ese sistema puede volverse poroso. El nuevo modelo de la compañía…

  • Cómo Gengram hace que los modelos de IA para ADN sean más rápidos y precisos

    Cómo Gengram hace que los modelos de IA para ADN sean más rápidos y precisos

    Nuevo módulo genómico amplía el enfoque de Engram de DeepSeek DeepSeek ha demostrado con Engram que una parte del conocimiento general puede salir de la cabeza del modelo y gestionarse en un diccionario ligero de referencias. Del modelo de lenguaje a la IA genómica Pocas semanas después de la publicación de Engram un equipo chino…

  • DeepSeek acelera textos largos y reduce costes

    DeepSeek acelera textos largos y reduce costes

    Nuevo modelo orientado a la eficiencia DeepSeek presenta con V3.2 Exp un modelo de lenguaje experimental pensado para manejar textos largos con menos recursos. En el centro del enfoque está una forma distinta de gestionar la atención, que reduce el esfuerzo de cálculo y el consumo de memoria sin que la calidad de las respuestas…