Passioni - Armando Passaro

Passioni › Informatica › AI e GPU

Panoramica: GPU computing nel homelab

04/03/2026 21:16

Le GPU non servono solo per il gaming: nel homelab sono il motore dell'inferenza AI, del transcoding video e del calcolo scientifico.

Server	GPU	VRAM	Utilizzo
TRANSCRIPTOR AI SERVER	2x Tesla P4	2x 8 GB	Ollama, inferenza LLM
HOMELAB	2x Tesla P100	2x 16 GB	Ollama, modelli grandi
ARMANDILLO AI	2x RTX 3060	2x 12 GB	vLLM Engine, inferenza veloce

Tesla P4: economica, 8 GB VRAM, basso consumo (75W), solo inferenza
Tesla P100: 16 GB HBM2, ottima per modelli grandi, buona per training leggero
RTX 3060: 12 GB GDDR6, consumer ma eccellente per inferenza, supporto tensor cores
Tesla V100: top gamma datacenter, 32 GB HBM2, ideale ma costosa usata

Con 6 GPU distribuite su 3 server, l'infrastruttura gestisce simultaneamente più modelli LLM per diversi casi d'uso.