Wil je slim inzicht in je inbox? Meld u aan voor onze wekelijkse nieuwsbrieven om te krijgen wat belangrijk is voor de Enterprise AI, data- en beveiligingsleiders. Abonneer u nu


Google Dipmind AI onderzoeksteam Er is Vandaag is een nieuw open source AI -model onthuld, Jemma 3 270 m.

Zou worden geadviseerd als zijn naam, het is een Modellen van 270 miljoen parameter – Veel Border LLMS is veel kleiner dan 70 miljard of meer parameters (parameters zijn het aantal interne instellingen die worden bediend door modelgedrag).

Hoewel meer parameters zich meestal vertalen in een groter en krachtiger model, waarmee de focus van Google bijna tegengesteld is: high-starry, geeft een model van ontwikkelaars Smartphone is klein genoeg om rechtstreeks naar de smartphone te rennen En Lokaal,, Zonder internetverbindingPixel 9 Pro SOS wordt weergegeven bij intern onderzoek.

Desalniettemin is het model nog steeds complex, in staat om domeinspecifieke taken uit te voeren en kan het in slechts enkele minuten sneller zijn om te passen bij eventuele ondernemings- of indie-ontwikkelaars.


Raakt de limiet van AI -schaling

Power caps, toenemende tokens -uitgaven en vertraging in veronderstellingen zijn opnieuw de Enterprise AI opnieuw te varen. Word lid van onze exclusieve salon om te ontdekken hoe toppartijen zijn:

  • Tact
  • Bekwame schattingen architecteren voor echte throputwinsten
  • Competitief meer ontgrendelen met duurzame AI -systemen

Bescherm uw plek om vooruit te blijven:: https://bit.ly/4mwgngo


Over Sociaal netwerk xGoogle Dipmind Staff AI Developer Relationship Engineer Omar Sunseviero voegde eraan toe dat het Jemma 3 270 Mio kan zijn Voer de webbrowser van een gebruiker rechtstreeks uit naar elke Raspberry PiEn “uw broodrooster” verwijst naar de mogelijkheid om zeer licht gewicht hardware te beheren.

Jemma 3 270m combineert 170 miljoen inbeddingsparameters – dankzij een groot 256k vocabulaire zeldzaam en in staat om specifieke tokens te verwerken – inclusief 100 miljoen transformatorblokparameters.

Volgens Google ondersteunt de architectuur krachtige uitvoeringen in instructies-inspirerende functies net buiten de doos terwijl hij kort genoeg is om snel delicate en apparaten met beperkte bronnen te implementeren.

Jemma 3 270 meter grotere Jemma 3 -modellen worden geërfd door de architectuur van 3 modellen, wat de consistentie met het zemma -ecosysteem bevestigt. Beschikbaar voor apparatuur zoals Face, Asleth en Jax, met documentatie, verfijnde recepten en ingezette gidsen, kunnen ontwikkelaars sneller van de test gaan.

Hoge score en hoge -knoping in benchmarks voor zijn grootte


Over Efaval benchmark, die het vermogen van een model meet om de instructies te volgenInstructie-sunded Jemma 3 270m scores 51,2%De

De score houdt het bij Smalm 2 135m instructie en koningin 2.5 B is goed bovenop dezelfde kleine modellen als instructiesEn volgens de vergelijking gepubliceerd door Google, zijn sommige miljard-parameter-modellen dicht bij de prestaties van het model.

AS Onderzoeker En Leiders Rivalen AI Startup Liquid AI X’s antwoorden op AI X, Google heeft zijn eigen opgegeven LFM2-350M-model onthuld terug In juli van dit jaar, die een perfect scoorde 65,12% Met nog een paar meer parameters (vergelijkbare taalmodellen).

Een van de gedefinieerde energie van het model is de krachtvaardigheden. In intern onderzoek met behulp van een Int4-gekantiseerd model op een Pixel 9 Pro SOS 25 gesprekken slikken slechts 0,75% van de batterij van het apparaat in.

Het maakt een praktische keuze voor Jemma 3 270m on-Divis AI, vooral in gevallen waarin privacy en offline effectiviteit belangrijk zijn.

De release omvat zowel een bewegende als een geïnstrueerd model, dat het onmiddellijke hulpprogramma van de ontwikkelaars geeft voor algemene instructies, een hulpprogramma.

Kwantisatie-bewuste getrainde (CAT) checkpoints maken ook de Int 4-nauwkeurigheid mogelijk met minimale prestatieschade en maken de productie van modellen voor de resource-gecontineerde omgeving.

Jemma 3 270m van een kleine, subtiele melodie -versie kan vele functies van Greater LLMS uitvoeren

In plaats van te vertrouwen op de grootte van het RAW -model, fram Google Jemma 3 270m als onderdeel van een breed beeld van het kiezen van de juiste tool voor werk.

Voor functies zoals sensatieanalyse, entiteitafvoer, queryroutering, structurele tekstgeneratie, toestemmingscontrole en creatief schrijven, heeft het bedrijf gezegd dat een subtiel melodiemodel snellere, duurdere resultaten kan bieden dan een grote algemene doeleinden.

De voordelen van specialisatie zijn duidelijk in het verleden werk, zoals de samenwerking van ML aangepast aan SK Telecom.

Een Gemma 3 4B -model is subtiel voor meertalige inhoudsbeperking, het team heeft een veel groter eigendomssysteem overtroffen.

Jamema 3 270m is ontworpen om op kleinere schaal vergelijkbaar succes mogelijk te maken, Ondersteuning van de vloot van speciale modellen die geschikt zijn voor afzonderlijke taken.

De Demo BageTime Story Generator -app toont de mogelijkheid van Jemma 3 270m

Naast het gebruik van onderneming past het model ook in creatieve situaties. A Demo -video geplaatst op YouTubeGoogle Jemma 3 270m en een Shelter Story -generator gemaakt met Transformers.js toont de app Voer volledig offline uit naar een webbrowser, Lichtgewicht, die de veelzijdigheid van het model in toegankelijke toepassingen toont.

https://www.youtube.com/watch?v=DS95V-AIU5E

De video is een hoofdpersoon (bijv. “Een magische kat”), een setting (“in een mantelbos”), een plotwending (“een geheime deur onthult”), een thema (“avontuur”) en een condensatie van de keuze voor een gewenste lengte (“kort”).

Zodra de parameters zijn ingesteld, creëert het Jemma 3 270m -model een goed bekend en fantasierijk verhaal. De app is een kort, avontuurlijk verhaal dat wordt geweven op basis van de voorkeuren van de gebruiker door het vermogen van het model voor creatieve, contextbewuste tekstgeneratie weer te geven.

Deze video werkt als een sterk voorbeeld Lichtgewicht is nog steeds ingeschakeld Jemma 3 270 M kan niet afhankelijk zijn van de wolken snel, aantrekkelijk en interactieve toepassingen.Open nieuwe mogelijkheden voor AI -ervaring in het apparaat.

Free-enthousiasts onder een Jemma Custom License

Jemma 3 wordt gepubliceerd onder de gebruiksvoorwaarden, waardoor het gebruik, de reproductie, de verandering en de verdeling van modellen en derivaten aan sommige voorwaarden kunnen worden voldaan.

Deze omvatten de beperkingen van het gebruik beschreven in het verboden gebruiksbeleid van Google, het verstrekken van de voorwaarden van de stroomafwaartse ontvangers, en zeker eventuele wijzigingen zijn aangebracht. Levering kan zijn via API- of webtoepassingen zoals directe of gehoste services.

Voor bedrijfsteams en commerciële ontwikkelaars betekent dit dat het model kan worden ingebed op producten, geïmplementeerd als onderdeel van cloudservices of subtiele deuntjes in gespecialiseerde derivaten, zolang de licentiecondities worden geëerd. Uitgangen geproduceerd door het model worden niet geclaimd door Google, bedrijven geven volledige rechten over hun materialen.

Ontwikkelaars zijn echter verantwoordelijk voor het creëren van naleving van de toepasselijke wetten en om verboden gebruik te voorkomen, zoals het creëren van schadelijk materiaal of het overtreden van privacyregels.

De De licentie is geen open source in de traditionele zin, maar maakt uitgebreid commercieel gebruik mogelijk zonder een afzonderlijke licentie.

Voor bedrijven om commerciële AI -applicaties te maken, worden belangrijke operationele overwegingen bevestigd door de implementatie van de equivalente beperkingen, modelwijzigingen in de eindgebruikers en de implementatie van het beveiligingssysteem verbonden met het verboden gebruiksbeleid.

Gemstors hebben 200 miljoen downloads gedownload en groter dan wolken, desktops en mobiel geoptimaliseerde varianten, Google AI-ontwikkelaars vormen de basis voor het creëren van snelle, dure en privacy-gecentreerde AI-oplossingen, en het lijkt al een goed begin.


Bronlink