Un consorzio costituito da dozzine di laboratori di tutto il mondo, in analogia con quelli che hanno portato a termine il Progetto genoma umano, dopo sei anni di lavoro ha concluso il sequenziamento del genoma bovino. In particolare è stato esaminato il patrimonio genetico di una vacca di razza Hereford, di nome Dominette, il primo caso di ruminante e in generale di mammifero di cui si è analizzato l'intero DNA, se si escludono l'uomo e gli animali da laboratorio. Nei 29 cromosomi somatici della mucca e nel suo cromosoma X sono stati individuati almeno 22.000 geni codificanti proteine, accompagnati da un numero elevatissimo di sequenze ripetute. Cinque dei 1.032 geni responsabili del metabolismo negli esseri umani sembrano però mancare, suggerendo la presenza di differenti vie metaboliche. «Ma quel che fa essere una mucca una mucca» ha commentato Harris Lewin, direttore dell'Institute for Genomic Biology dell'Università dell'Illinois, uno dei coordinatori dell'impresa «sono soprattutto le caratteristiche legate alla riproduzione, alla produzione di latte e al sistema immunitario dell'animale, che aprono nuove prospettive di studio a favore degli allevamenti».
Mucca svelata
prossimo articolo
LLM e ricerca scientifica: opportunità, rischi e controlli

Come integrare i modelli linguistici di grandi dimensioni nel processo scientifico senza comprometterne l'integrità? Gli LLM sono utili quando velocizzano lavoro ripetitivo e preparatorio. Diventano rischiosi quando il loro output entra direttamente nel processo di validazione o nella decisione scientifica. La questione da porre non è se ma come integrarli nel processo scientifico senza comprometterne l'integrità.
Immagine di copertina realizzata con ChatGPT
Nel discorso pubblico, intelligenza artificiale e Large Language Model (LLM) vengono spesso usati come sinonimi. Non lo sono. L'IA è il campo più ampio che comprende tecniche diverse — dai sistemi simbolici all'apprendimento automatico, dalla visione artificiale alla robotica, fino ai modelli generativi. Gli LLM sono una classe specifica di questi sistemi: modelli addestrati su grandi quantità di testo e, sempre più spesso, di dati multimodali, capaci di produrre risposte linguisticamente plausibili, codice, sintesi, classificazioni e proposte operative.