Introduzione all'inclusività nei modelli di Intelligenza Artificiale
A livello mondiale è risaputo che la maggior parte dei modelli di Intelligenza Artificiale sono addestrati con un dataset in lingua inglese, oltre alla lingua anche con bias e riferimenti alla cultura nordamericana, occidentale; oltre all'accuratezza nei benchmark in lingue diverse, anche la comprensione del contesto economico, legale, sociale di culture con rappresentazione minoritaria, generalmente viene meno e il motivo è semplice, il modello è accurato per il contesto, per i dati su cui è stato addestrato. Quindi se alleni/continui il pretraining su lingue target (e idealmente su dati locali), ottieni risposte più naturali e utili in quelle lingue e in quei contesti, motivo per cui sono nati progetti locali, che consentono un migliore utilizzo e rappresentatività, inclusività.
Il test: Mistral AI vs Sailor2
Il test è stato eseguito in locale, tramite Ollama: il modello mistral:7b (Mistral AI), con prompt in lingua italiana e il modello sailor2:8b (sviluppato da Sea Limited, holding con sede a Singapore), con prompt in lingua indonesiana.
Più nello specifico, il test si articola in questo modo:
- Mistral-7B: prompt in lingua inglese, prompt in lingua italiana (Mistral è rappresentativo per la lingua italiana, mi aspetto qualità della risposta simile all'inglese)
- Sailor2-8B: prompt in lingua inglese, prompt in lingua indonesiana (Sailor è rappresentativo per la lingua indonesiana, mi aspetto qualità della risposta simile all'inglese)
- verifica incrociata: prompt in lingua indonesiana per Mistral, lingua italiana per Sailor: non essendo rappresentativo, la qualità della risposta dovrebbe calare (dimostrando l'importanza dell'addestramento selettivo ai fini dell'inclusività e rappresentazione minoritaria)
La scelta di modelli 7/8 B viene fatta per due motivi: semplice installazione in locale, su un computer domestico e non in Cloud su un server, quindi uso di risorse limitato (verrà anche discussa poi l'efficienza nell'uso di risorse, RAM richiesta per l'inferenza con questi modelli); il secondo motivo è che modelli top (GPT-5.x, Gemini-3.x) sono talmente grandi e diversificati per cui risulterebbe più difficile cogliere sfumature (ovvero un modello da soli 7/8 B parametri, se non è ben addestrato in una lingua il risultato è evidente, con modelli da 1000+ B parametri il risultato del test sarebbe meno chiaro).
Prima di iniziare con il test, un accenno:
- Sailor2 (sito ufficiale sea-sailor.github.io) è open-source e sviluppato da Sea AI Lab, una divisione di SEA Ltd; ha lo scopo di eccellenza tecnica multilingue, specializzato nel sudest asiatico
- Mistral AI (sito ufficiale mistral.ai)) è open-source, sviluppato dalla francese Mistral AI; focus su cultura e lingue europee, GDPR, ecc
Il prompt che ho usato riguarda il contesto finanziario (nota: è molto importante considerare anche la complessità, quindi no semplice traduzione, ma gestione di un settore di competenza e test per istruzioni di tipo "instruct"), lo scrivo nelle rispettive lingue:
- 🇮🇹 Italiano: [finanza] Puoi spiegare P/CF, con esempi?
- 🇺🇸🇬🇧 Inglese: [finance] Can you explain P/CF ratio, with examples?
- 🇮🇩 Indonesiano: [keuangan] Bisakah Anda menjelaskan rasio P/CF kepada saya, beserta contohnya?
Test con Sailor 2 (arch qwen2, 8,55B parametri, quantizzazione Q4_K_M)
Questo è stato l'output del modello, in lingua inglese:
**P/E vs P/CF Ratio: Unlocking the **Cash Flow Per Share (CFS/Investor)**
perspective (Why P/CF = New Smart Stock Depth)**
In finance, **Understanding how markets price companies goes beyond just
traditional **P/E (Price-to-Earnings)** ratio—into the refined lens of
**P/CF** (Price-to-Cash-Flow). It emphasizes operational cash performance
rather than earnings (which can be manipulated via accounting tricks or
non-cash expenses).
**P/CF Ratio Definition:**
The Price-to-Cash Flow Ratio (`P/CF`) evaluates a stock's market price
relative to its Cash Flow Per Share (CFS, also termed **Cash Flow per
Equity** for consistency within financial frameworks—equivalent **pennies
of cash delivered per share invested**). The formula is:
\[ \text{P/CF} = \frac{\text{Market Price}}{\text{Annual Free Cash Flow
per Share (FCFS)}} \]
Where:
- **Market Price**: Current stock price.
- **Free Cash Flow Per Share (FCFS)**: Calculated by subtracting non-cash
operating expenses, capital expenditures, and adjustments (e.g., interest
payments treated as cash outflows) from net income.
**Core Advantages of P/CF Ratio:**
1. **Operational Health Indicator**: Focuses on actual operational profits
in cash terms.
2. **Resilience to Accounting Manipulations**: Less susceptible to
manipulative earnings practices (like accruals, non-cash charges).
3. **Simpler Valuation for Cash-Generators**: Especially beneficial for
firms generating substantial free cash from operations (e.g., utilities,
REITs, consumer staples).
4. **Risk Mitigation in Financial Stress**: Companies with high P/CF can
sustain better during economic downturns and financial crises.
5. **Investment Quality Filter**: Lower P/CF ratios can signal undervalued
or superior investment opportunities.
**Example Walkthrough Calculation & Interpretation:**
**Company A (Fictional)**:
- Market Price = $40 per share
- Annual Free Cash Flow per Share (FCFS) = $5.20
To find the P/CF ratio for Company A:
\[ \text{P/CF} = \frac{\$40}{\$5.20} ≈ 7.69 \]
**Interpretation:**
- **High P/CF (e.g., < 10):** If less than a typical industry benchmark or
similar mature companies, Company A might be considered undervalued given
its substantial cash flow generation.
- Example Industry Norm (average FCFS = $3.5 per share for peers):
7.69 / 3.5 ≈ **2.18x**, indicating a potentially more attractive deal
compared to industry standards (~2-4 times P/CF usually healthy).
**In Practice: Comparing with Key Use Cases:**
1. **Growth vs Value**: High-growth startups might exhibit higher P/E but
lower P/CF (focusing on future cash flow expectations). A balanced P/CF of
5–7 could be considered fair, versus a startup's P/E of 20–30.
- E.g., Tech Pioneer X: FCFS = $1.8; Market Price =$20 -> P/CF = 11.1
(Early-stage caution; seek investor alignment on growth forecasts).
2. **Consistent Cash Generators**: Utilities, REITs, or consumer staples
usually maintain stable and predictable cash flows. Their P/CF ratios
might consistently stay below 8.
- **Utility Co Y**: FCFS = $4.5; Market Price=$36 -> P/CF = 8 (stable,
low-risk, suitable for income investors).
3. **Crisis Resilience Analysis**: During economic downturns, firms with
lower P/CFs (e.g., <6) demonstrate better financial resilience.
- **Real Estate Investment Trust Z**: FCFS= $2.7; Market Price=$21 ->
P/CF = 7.8 (sustains cash flow amidst uncertainties, likely to outperform
post-recovery).
**Strategic Insights and Decision-Making:**
- **Investment Screening**: Use the P/CF ratio as a filter to shortlist
stocks with attractive ratios.
- **Dilution & Growth Analysis**: Monitor FCFS changes for dilutive
capital raises or strategic growth investments. A well-managed increase in
cash flow can justify higher P/CF over time.
- **Benchmarking vs Market Norms**: Periodically compare company P/CF to
industry norms and historical data to ensure valuation consistency.
**Conclusion:**
The **P/CF ratio** offers a powerful lens for investors seeking to assess
the intrinsic value of a stock based on its actual cash flow generation.
By shifting from Earnings-based (P/E) metrics, it provides a deeper
understanding of a company's operational strength and financial health,
making it a vital tool in investment analysis.
Remember to:
- **Regularly update FCFS calculations**.
- **Contextualize ratios within industry peers and historical trends**.
- **Combine with other valuation ratios and financial metrics** (e.g.,
ROE, PEG).
Using the P/CF ratio, you'll better discern undervalued gems or overvalued
traps in your investment portfolio.
Good investing!
Per non appesantire troppo la lettura, non viene testualmente anche l'output indonesiano e italiano, ma solo successivi screenshot di comparazione con Mistral e commenti, a conferma dell'ipotesi di partenza.
Test con Mistral (arch llama, 7,25B parametri, quantizzazione Q4_K_M)
Questo è stato l'output del modello, in lingua inglese:
Sure! The Price to Cash Flow (P/CF) ratio is a valuation metric used in
finance that measures the price of a stock relative to its cash flow. It
helps investors evaluate whether a company's current price reflects its
cash-generating abilities.
The P/CF ratio is calculated by dividing a company's market capitalization
(the total value of all outstanding shares) by its cash flow from
operations (CFO). Here's the formula:
P/CF Ratio = Market Capitalization / Cash Flow from Operations
The cash flow from operations represents the cash that a company generates
from its core business activities, excluding investments and financing
activities. It is calculated as Net Income + Depreciation and Amortization
- Taxes Paid + Changes in Working Capital (Current Assets - Current
Liabilities).
For example, let's take Company A with a market capitalization of $10
billion and cash flow from operations of $2 billion per year. To calculate
the P/CF ratio for Company A:
P/CF Ratio = Market Capitalization / Cash Flow from Operations
= 10,000 million / 2,000 million
= 5 (approximately)
A P/CF ratio of 5 means that it takes five years for the company's cash
flow to pay off its current market value. A lower P/CF ratio is generally
considered better because it indicates a more attractive valuation
relative to the company's cash-generating abilities. However, it's
essential to compare companies within the same industry, as the average
P/CF ratios can vary significantly across different sectors.
Here are a few examples of P/CF ratios for well-known companies:
1. Microsoft (MSFT) - As of Q2 2023, Microsoft's P/CF ratio is
approximately 20.54. This means it would take around 5 years for the
company's cash flow to pay off its current market value if its cash flow
remained constant.
2. Amazon (AMZN) - As of Q2 2023, Amazon's P/CF ratio is approximately
39.86. This indicates that it would take roughly 10 years for the
company's cash flow to pay off its current market value if its cash flow
remained constant.
3. Johnson & Johnson (JNJ) - As of Q2 2023, Johnson & Johnson's P/CF ratio
is approximately 14.67. This suggests that it would take around 7 years
for the company's cash flow to pay off its current market value if its
cash flow remained constant.
Analogamente a prima, per non appesantire troppo la lettura non viene riportato per intero l'output nelle altre due lingue.
Confronto e analisi dei risultati
Nota importante: lingua italiana e lingua inglese sono state valutate direttamente; per la lingua indonesiana è stato fatto affidamento ad un controllo incrociato tramite i tool Perplexity AI e SEA-LION.AI (di cui approfondiamo meglio nel seguito, un'altra famiglia di modelli specializzati per il contesto del sudest asiatico)
In generale, è evidente che la risposta di Mistral (confronto diretto, lingua inglese) è più coincisa, Sailor2 entra più nei dettagli (per il prompt tecnico, quando usare P/CF: vantaggi nell'uso di questo approccio, cosa significa se il rapporto è alto piuttosto che basso...). Entrambe corrette e di buona qualità (stiamo parlando di modelli 7/8 B, quindi risultato notevole!). Nel calcolo di P/CF i due modelli usano formule differenti (Mistral come riferimento si basa sulla capitalizzazione, Sailor2 sul prezzo per azione, comunque entrambe le definizioni sono corrette). Mistral impagina correttamente le formule, Sailor2 almeno in questa versione su Ollama, riporta il codice LaTex testuale, non impaginato (ad esempio \[ \text{P/CF} = \frac{\text{Market Price}}{\text{Annual Free Cash Flow per Share (FCFS)}} \]). Questo per quanto riguarda la lingua inglese. Vediamo ora l'aspetto più interessante del test.
- Mistral in Indonesiano: poche imprecisioni grammaticali, qualità non troppo inferiore a Sailor2
- Sailor2 in Italiano: la risposta è sempre più lunga e dettagliata come struttura; precisione, correttezza grammaticale discreta (Mistral in Italiano è risultato perfetto - certamente lingua più rappresentata, analogamente all'Indonesiano per Sailor2 -, mentre Sailor2 compie qualche errore di grammatica e sintassi, correttezza, completezza e qualità della risposta comunque sempre buona.

In conclusione, non c'è un vero vincitore, lo scopo è stato quello di dimostrare che la qualità linguistica dipende dai dati di addestramento, inoltre l'inclusività non è una questione di "politically correct" ma anche di marketing, uno sviluppo di IA verticale per un settore o contesto di minoranza (cultura, lingua...) può offrire qualità specifica superiore e quindi adozione da parte di aziende, enti, ecc. Questo test si è concentrato su un unico caso e con maggiore focus sulla correttezza linguistica più che uno studio approfondito di cultura e tradizioni (un nativo o studi molto più approfonditi e specifici, potrebbero indagare meglio in questo ambito). A livello generale è emerso che, entrambi modelli di dimensioni simili (7B, 8B), Sailor2 è più completo e dettagliato, Mistral più coinciso e preciso anche nelle traduzioni in diverse lingue. Buona efficienza per entrambi nell'uso di risorse (Mistral 6,5 GB di RAM tramite Htop - e sistema operativo Linux Mint 21.3 Cinnamon con browser Firefox aperto per scrivere questa discussione 😁, Sailor2 7,5 GB di RAM, ricordiamo che Mistral è un modello 7B, Sailor 8B). Chiaramente è stato comunque confermata la tesi iniziale, ovvero qualità, accuratezza linguistica superiore per Mistral in lingua italiana, per Sailor2 in lingua indonesiana. I benchmark SEA-HELM (AI Singapore, leaderboard.sea-lion.ai) sono appositamente pensati per mettere in risalto competenze linguistiche e culturali in lingue del Sud-Est asiatico.
Bonus: SEA-LION vs Sailor
Il progetto Sailor, oggi in versione Sailor2, è appunto sviluppato da Sea AI Lab (divisione di SEA Ltd). SEA-LION è invece un progetto di AI Singapore, ente pubblico, quindi un progetto nazionale: focus sempre sudest asiatico (SEA) ma con maggiore enfasi sulla cultura locale, mentre per Sailor il focus è l'eccellenza tecnica multilingue; AI Singapore è quindi un progetto governativo, istituzionale, Sailor è privato e community-driven.