Apple lance une nouvelle famille de modèles de langage efficaces open source à mesure que les travaux sur l’IA progressent

Marion Legrand

Avant les débuts d’iOS 18 à la WWDC en juin, Apple a publié une famille de grands modèles de langage open source. Appelés OpenELM, Apple les décrit comme : une famille de Ouvrir-source Eefficace Llangue Mmodèles.

Lors de ses tests, Apple affirme qu’OpenELM offre des performances similaires à celles d’autres modèles de langage ouvert, mais avec moins de données de formation.

Apple explique :

À cette fin, nous publions OpenELM, un modèle de langage ouvert de pointe. OpenELM utilise une stratégie de mise à l’échelle par couche pour allouer efficacement les paramètres au sein de chaque couche du modèle de transformateur, conduisant à une précision améliorée. Par exemple, avec un budget de paramètres d’environ un milliard de paramètres, OpenELM présente une amélioration de 2,36 % en termes de précision par rapport à OLMo tout en nécessitant 2 fois moins de jetons de pré-entraînement.

S’écartant des pratiques antérieures qui fournissent uniquement des poids de modèle et un code d’inférence, et pré-entraînent sur des ensembles de données privés, notre version inclut le cadre complet pour l’entraînement et l’évaluation du modèle de langage sur des ensembles de données accessibles au public, y compris les journaux d’entraînement, plusieurs points de contrôle et la pré-formation. configurations de formation. Nous publions également du code pour convertir les modèles en bibliothèque MLX à des fins d’inférence et de réglage fin sur les appareils Apple. Cette version complète vise à responsabiliser et à renforcer la communauté de recherche ouverte, ouvrant la voie à de futurs efforts de recherche ouverte.

Vous pouvez trouver plus de détails sur les liens ci-dessous :

iOS 18 inclura un ensemble de nouvelles fonctionnalités d’intelligence artificielle, et la version OpenELM d’aujourd’hui n’est que la dernière étape du travail de préparation d’Apple en coulisses.

Bloomberg a rapporté la semaine dernière que les fonctionnalités d’IA d’iOS 18 seront alimentées par un grand modèle de langage entièrement intégré à l’appareil, qui offrira des avantages en matière de confidentialité et de vitesse.

Suivre Chance: Sujets, Twitter, Instagramet Mastodonte.

FTC : Nous utilisons des liens d’affiliation automatique générateurs de revenus. Plus.


Laisser un commentaire

Quitter la version mobile