News Bloomberg ha creato un LLM per il settore finanziario
2' 27''
11/04/2023

Un documento di ricerca ha presentato e illustrato il progetto di Large Language Model sviluppato da Bloomberg per il settore della finanza.

Bloomberg ha creato un LLM per il settore finanziario

Bloomberg ha pubblicato un documento di ricerca che descrive lo sviluppo di BloombergGPT, un modello di intelligenza artificiale generativa addestrato su dati finanziari per migliorare le attività di elaborazione del linguaggio naturale (NLP) nel settore finanziario.

BloombergGPT è un modello linguistico di grandi dimensioni (LLM) specificamente addestrato su una vasta gamma di dati finanziari. Questo modello aiuterà Bloomberg a migliorare le attività di natural language processing finanziario come l'analisi del sentiment, il riconoscimento delle entità nominate, la classificazione delle notizie e la risposta alle domande.

Unsplash
Cervello

Gestire la complessità del mondo finanziario

Nelle intenzioni degli sviluppatori, BloombergGPT vuole sbloccare nuove opportunità per gestire grandi quantità di dati sui terminali Bloomberg e aiutare i clienti dell'azienda, portando al contempo il pieno potenziale dell'IA nel dominio finanziario.

La complessità e la terminologia unica del dominio finanziario giustificano un modello specifico come BloombergGPT, che rappresenta il primo passo nello sviluppo e nell'applicazione di questa nuova tecnologia nel settore finanziario.

BloombergGPT combina dati finanziari con set di dati generici per raggiungere i migliori risultati sui benchmark relativi al settore finanziario, mantenendosi competitivo anche nei benchmark LLM generici.

Bloomberg
Benchmark
I principali risultati dei benchmark registrati da BloombergGPT

Per addestrare il modello, il team di ricerca di Bloomberg ha utilizzato un set di dati completo di 363 miliardi di token costituito da documenti finanziari in lingua inglese e lo ha integrato con un set di dati pubblico di 345 miliardi di token, creando un corpus di addestramento di oltre 700 miliardi di token.

Il modello è stato convalidato su benchmark NLP specifici per la finanza esistenti, una suite di benchmark interni di Bloomberg e ampie categorie di attività NLP generiche. BloombergGPT ha dimostrato di superare i modelli aperti esistenti di dimensioni simili sulle attività finanziarie con ampi margini, mantenendo allo stesso tempo prestazioni pari o migliori anche sui benchmark NLP generali.

Un archivio inestimabile

Il team ML Product and Research ha collaborato con il team AI Engineering dell'azienda per costruire uno dei più grandi set di dati specifici, attingendo alle risorse esistenti per la creazione, la raccolta e la cura dei dati dell'azienda, che coprono quarant'anni di documenti finanziari.

Shawn Edwards
Shawn Edwards, CTO di Bloomberg

Shawn Edwards, CTO di Bloomberg, ha commentato: “Vediamo un enorme valore nell'aver sviluppato il primo LLM focalizzato sul dominio finanziario. BloombergGPT ci consentirà di implementare nuovi tipi di applicazioni, mentre offre prestazioni molto più elevate rispetto ai modelli personalizzati, con un time-to-market più rapido”.

Gideon Mann, responsabile del team ML Product and Research di Bloomberg, ha spiegato: “La qualità dei modelli di machine learning e NLP dipende dai dati che si inseriscono. Grazie all’archivio di documenti finanziari che Bloomberg ha curato per oltre quattro decenni, siamo stati in grado di creare un set di dati ampio e pulito, specifico del dominio, per addestrare un LLM più adatto per i casi d'uso finanziari”.

Potrebbe interessarti anche

Approfondimenti

Risolvere i problemi delle cartelle cliniche digitali con l'IA

L'intelligenza artificiale può migliorare la gestione delle cartelle cliniche elettroniche e semplificare le visite per...

News

GPTZero per combattere il plagio accademico

Uno studente di Princeton ha sviluppato GPTZero, un programma in grado di individuare se un testo è stato scritto da una...

News

Processare documenti e immagini con Amazon Comprehend

Amazon ha annunciato una nuova feature di Comprehend per classificare testi in formati semi strutturati, senza passare p...

News

Galactica ha fallito: addio al modello NLP per la scienza

Galactica, un modello NLP per l'elaborazione di testi scientifici, non ha passato i test: l'algoritmo non è riuscito a p...