Les géants de la technologie aiment se vanter d’environ un milliard de modèles d’IA paramètres qui nécessitent des grappes GPU massives et coûteuses. Mais Fastino adopte une approche différente.
La startup basée à Palo Alto dit qu’elle a inventé un nouveau type d’architecture de modèle d’IA qui est intentionnellement petite et spécifique à la tâche. Les modèles sont si petits qu’ils sont formés avec des GPU de jeu bas de gamme d’une valeur de moins de 100 000 $ au total, dit Fastino.
La méthode attire l’attention. Fastino a obtenu 17,5 millions de dollars en financement de semences dirigé par Khosla Ventures, le premier investisseur de Venture d’Openai, Fastino explique exclusivement à TechCrunch.
Cela porte le financement total de la startup à près de 25 millions de dollars. Il a levé 7 millions de dollars en novembre dernier dans une ronde pré-série dirigée par VC ARM M12 et Insight Partners de Microsoft.
«Nos modèles sont plus rapides, plus précis et coûtent une fraction pour s’entraîner tout en surpassant les modèles phares sur des tâches spécifiques», explique Ash Lewis, PDG et co-fondateur de Fastino.
Fastino a construit une suite de petits modèles qu’il vend aux clients d’entreprise. Chaque modèle se concentre sur une tâche spécifique dont une entreprise peut avoir besoin, comme la réduction des données sensibles ou le résumé des documents d’entreprise.
Fastino ne divulgue pas encore les métriques ou les utilisateurs précoces, mais dit que ses performances épater les premiers utilisateurs. Par exemple, comme ils sont si petits, ses modèles peuvent fournir une réponse entière dans un seul jeton, Lewis a déclaré à TechCrunch, montrant la technologie donnant une réponse détaillée en même temps en millisecondes.
Événement TechCrunch
Berkeley, CA
|
5 juin
Réserver maintenant
Il est encore un peu tôt pour dire si l’approche de Fastino se reproduira. L’espace de l’IA de l’entreprise est bondé, des sociétés comme Cohere et Databricks vantant également l’IA qui excelle dans certaines tâches. Et les fabricants de modèles SATA axés sur l’entreprise, notamment anthropiques et Mistral, proposent également de petits modèles. Ce n’est pas un secret non plus que l’avenir de l’IA génératif pour l’entreprise est probablement dans des modèles de langage plus petits et plus ciblés.
Le temps peut dire, mais un vote de confiance précoce de Khosla ne fait certainement pas de mal. Pour l’instant, Fastino dit qu’il est axé sur la construction d’une équipe d’IA de pointe. Il cible les chercheurs dans les meilleurs laboratoires AI qui ne sont pas obsédés par la construction du plus grand modèle ou le battement des repères.
«Notre stratégie d’embauche est très axée sur les chercheurs qui ont peut-être un processus de réflexion contre la construction de modèles de langue en ce moment», explique Lewis.