Dati aziendali aperti negli Stati Uniti: fonti ufficiali, API e diritti di riutilizzo
Gli Stati Uniti possiedono un solido ecosistema di dati aziendali ufficiali, ma non bisogna ridurlo a un semplice elenco di imprese. Il modo corretto di valutare gli Stati Uniti è partire dal registro ufficiale, per poi aggiungere i livelli relativi a dati aperti, statistiche, appalti, proprietà intellettuale e autorità di regolamentazione.
Il percorso più efficace prevede l'utilizzo dei registri statali delle imprese per verificare l'esistenza legale delle società private, del database EDGAR della SEC per le società soggette a obblighi di rendicontazione, di SAM.gov e USAspending per gli appaltatori federali e i beneficiari di sovvenzioni, dei dati sulle organizzazioni esenti da imposte dell'IRS, dei dati sui marchi registrati dell'USPTO, del controllo delle sanzioni dell'OFAC e del FinCEN BOI come limite di conformità riservato e non pubblico. Questo rende gli Stati Uniti una mappa decentralizzata delle fonti federali e statali, non un unico registro nazionale delle imprese, ma non elimina i consueti controlli di riutilizzo: termini del set di dati, attribuzione, clausole di non approvazione, privacy, limiti imposti dalla normativa sul marketing e attualità delle fonti.
Questa guida mappa le principali fonti ufficiali di dati aziendali negli Stati Uniti, spiega cosa può e non può fare ciascuna fonte e mostra in che modo un set di dati normalizzato in stile CompaniesData può apportare valore aggiunto.
La questione più profonda non è se una fonte esista o meno. La domanda utile è piuttosto quale fonte sia affidabile per l'identificazione, quale provi eventi o documenti, quale sia utilizzabile su larga scala, quale sia solo un servizio manuale e quali campi diventino legalmente sensibili una volta che i dati vengono riutilizzati a fini commerciali.
Risposta rapida
Negli Stati Uniti, le informazioni pubblicabili si limitano a una guida decentralizzata basata su fonti ufficiali. Le API federali e i dataset di grandi dimensioni sono utili per le società soggette agli obblighi di rendicontazione della SEC, gli appaltatori federali, i beneficiari di finanziamenti federali, le organizzazioni esenti da imposte, i marchi e il controllo delle sanzioni, ma la registrazione delle società private è gestita a livello statale e non esiste un registro federale completo e pubblico delle imprese.
Per il lavoro pratico, lo stack di fonti più utile è il seguente: API SEC EDGAR, data.sec.gov, risorse per sviluppatori SEC, informazioni sulle entità SAM.gov, API di gestione delle entità SAM.gov, API di estrazione di entità/esclusioni SAM.
La risposta editoriale più prudente è questa: gli Stati Uniti dispongono di solide fonti pubbliche e ufficiali di dati commerciali, ma i dati pubblici non sono automaticamente scaricabili in blocco, pronti per il marketing o esenti da vincoli relativi ai dati personali.
Un dataset serio degli Stati Uniti necessita in genere di almeno quattro livelli: il registro legale per l'identità dell'entità, le pubblicazioni o i documenti ufficiali relativi agli eventi di cambiamento, le fonti di appalti pubblici/regolamentari/proprietà intellettuale/statistiche per l'arricchimento dei dati e un livello di conformità separato per la privacy, l'utilizzo dei dati di contatto, la soppressione e la comunicazione legale.
Punti chiave
- Il miglior punto di partenza: Registri statali delle imprese per la validità legale delle società private, SEC EDGAR per le società che presentano rendicontazioni, SAM.gov e USAspending per gli appaltatori federali e i beneficiari di sovvenzioni, dati IRS sulle organizzazioni esenti da imposte, dati USPTO sui marchi, screening delle sanzioni OFAC e FinCEN BOI come confine di conformità non pubblico e ristretto.
- Stack sorgente principale: API EDGAR della SEC, data.sec.gov, risorse per sviluppatori della SEC, informazioni sulle entità di SAM.gov, API di gestione delle entità di SAM.gov, API di estrazione di entità/esclusioni di SAM.
- Regola di riutilizzo: La visibilità pubblica non è la stessa cosa del riutilizzo in massa, dell'autorizzazione alla rivendita o dell'autorizzazione a contatti commerciali.
- Valore per l'acquirente: Il set di dati utile è la versione normalizzata, deduplicata e verificabile alla fonte, non un elenco grezzo di link al portale.
- Separazione commerciale: I documenti ufficiali dell'azienda, i profili aziendali dettagliati e i dati di contatto commerciali devono rimanere livelli separati con note di conformità distinte.
Metodologia editoriale
Questo articolo utilizza un metodo che privilegia le fonti ufficiali. Le fonti sono incluse quando contribuiscono a verificare l'esistenza legale, i documenti pubblici, le attività di appalto, il contesto del contribuente o dell'identificativo, la titolarità della proprietà intellettuale, lo status regolamentato, le statistiche o il contesto di conformità legale. I fornitori commerciali e i prodotti di dati di contatto non sono utilizzati come autorità per i diritti di riutilizzo ufficiali.
- È preferibile consultare il registro nazionale, la Camera di Commercio, la Gazzetta Ufficiale o l'autorità ufficiale preposta alla registrazione delle imprese, prima di ricorrere a qualsiasi fonte secondaria.
- Classifica l'accesso come ricerca, API, download in blocco, estrazione a pagamento, abbonamento, flusso di lavoro documentale, catalogo dati o accesso non chiaro/manuale.
- Separare i dati relativi alle persone giuridiche dalle statistiche di costituzione, dai fornitori, dalle informazioni divulgate dalle società quotate, dai codici fiscali e dai dati di contatto privati.
- Trattare i titolari effettivi, i funzionari, gli indirizzi, le firme, gli avvisi di insolvenza e i registri delle ditte individuali come informazioni sensibili, a meno che la fonte e la legge non ne consentano espressamente il riutilizzo.
- Sospendere o omettere i link di origine instabili quando il controllo qualità in tempo reale mostra errori 403, 429, 5xx, problemi DNS, TLS o timeout che potrebbero generare rumore dovuto a link non funzionanti.
Cosa si intende per dati aziendali negli Stati Uniti?
| Strato | Esempi | Uso aziendale tipico |
|---|---|---|
| Identità di registro | Nome legale, numero di registrazione, stato civile, forma giuridica, sede legale | Corrispondenza delle entità, deduplicazione e KYB |
| Registrati agli eventi | Costituzione, modifiche, depositi, estratti, pubblicazioni | Cronologia aziendale e tracciabilità legale |
| Livello dati aperti/API | Set di dati ufficiali, API, servizi CSV/JSON/XML ove disponibili | Ingestione e monitoraggio automatizzati |
| Statistiche | Dati demografici aziendali, numero di imprese, totali per settore/area geografica | Dimensionamento del mercato e parametri di riferimento per la qualità dei dati |
| Procurement | Gare d'appalto, aggiudicazioni, fornitori e autorità appaltanti | Informazioni sulle vendite nel settore pubblico |
| Proprietà intellettuale e autorità di regolamentazione | Marchi, brevetti, enti vigilati e decisioni | Screening di arricchimento e conformità |
| Informazioni di contatto | Email, telefono, ruoli dei contatti e segmentazione | Commercializzazione consentita solo con una base giuridica separata |
Negli Stati Uniti, questi livelli non dovrebbero essere accorpati in un unico database indifferenziato. Un risultato di registrazione può provare l'esistenza legale, un avviso di appalto può provare l'attività nel settore pubblico, un record di proprietà intellettuale può provare la titolarità di un marchio o di un'invenzione e un elenco di autorità di regolamentazione può provare la supervisione. Si tratta di fatti diversi con cicli di aggiornamento, identificatori e limiti di riutilizzo differenti.
Diritti di riutilizzo e conformità
A livello internazionale, le politiche relative alle informazioni del settore pubblico e ai dati aperti possono favorire il riutilizzo dei dati del settore pubblico, e le normative sui dataset di alto valore considerano sempre più i dati aziendali e sulla proprietà delle aziende come importanti informazioni pubbliche. In pratica, la posizione effettiva degli Stati Uniti in materia di riutilizzo dipende ancora da ciascuna fonte, punto di accesso, licenza e metodo di accesso.
- Citare fonti ufficiali e conservare le date di aggiornamento laddove fornite dalla fonte.
- Non si deve insinuare che un set di dati derivato sia approvato dal registro o dall'autorità pubblica.
- Non mescolare i dati dei registri pubblici con l'autorizzazione a essere contattati per finalità di marketing.
- Verifica se le condizioni relative ad API, download in blocco, estrazione a pagamento e accesso tramite ricerca web sono diverse.
- Trattare i dati relativi a dirigenti, titolari effettivi e persone fisiche come dati sensibili ai sensi del GDPR, ove applicabile.
Pubblicabile solo come mappa decentralizzata di fonte ufficiale; non come registro nazionale in stile Companies House.
Rischi relativi a copertura, accesso e aggiornamento
L'errore più comune nel lavoro con i dati aziendali negli Stati Uniti è quello di confondere la visibilità con la completezza. Una schermata di ricerca pubblica può essere autorevole per la ricerca di una singola entità, ma non adatta all'acquisizione di grandi quantità di dati. Un set di dati scaricabile può essere riutilizzabile per un'istantanea definita, pur escludendo depositi, documenti, amministratori, entità inattive o modifiche storiche.
- Copertura: specificare se la fonte copre aziende, denominazioni commerciali, filiali, organizzazioni non profit, ditte individuali, emittenti quotati, enti regolamentati o solo un sottoinsieme di settori.
- Aggiornamento: preservare la data di aggiornamento della fonte ed evitare di mescolare i risultati del portale in tempo reale con vecchi file scaricati privi di indicazione di versione.
- Identificativi: numeri di registrazione cartografica, identificativi fiscali, ID fornitore, record LEI e ticker di borsa come chiavi separate fino alla verifica.
- Lingua e formati: normalizzare con cura i nomi nella lingua locale, le forme legali, la traslitterazione, gli accenti, le abbreviazioni e i formati degli indirizzi.
- Accesso operativo: documentare se il flusso di lavoro è tramite ricerca pubblica, API, file in blocco, estrazione a pagamento, servizio riservato agli utenti registrati, PDF, CKAN/OData/SPARQL o richiesta manuale.
Lista di controllo per il riutilizzo negli Stati Uniti
| Strato | Utile per | Attenzione al riutilizzo negli Stati Uniti |
|---|---|---|
| Ricerca pubblica | Ideale per la verifica e il controllo qualità manuale. | Potrebbe vietare la raschiatura, l'estrazione in massa o il riutilizzo automatizzato |
| API o set di dati | Il percorso migliore per un'ingestione ripetibile | I termini relativi agli endpoint, all'attribuzione e ai limiti di tariffazione rimangono validi. |
| Estratto o certificato a pagamento | Utile per la certezza del diritto | Solitamente si tratta di accordi contrattuali, documenti e non di un set di dati aperto. |
| Dati relativi agli appalti e alla regolamentazione | Livello di arricchimento e monitoraggio avanzato | Copertura parziale; non si tratta di un registro aziendale universale. |
| campi relativi a funzionario, proprietario o indirizzo | Utile per KYB e conformità laddove consentito dalla legge | Consenso al marketing sensibile alla privacy e mai automatico |
| Email e numeri di telefono aziendali | Livello di comunicazione commerciale | Richiede una base giuridica separata, una logica di esclusione e una governance dei dati di contatto |
Modello di registro a 50 stati: perché gli Stati Uniti sono diversi
Gli Stati Uniti non dispongono di un unico registro nazionale pubblico delle imprese per le società private. Le LLC, le società per azioni e molte società di persone vengono costituite o qualificate tramite le autorità statali e territoriali. Un set di dati utile sulle società statunitensi è quindi un progetto di integrazione di registri, non un download da un'unica fonte.
- Stato di formazione: memorizza lo stato in cui l'entità è costituita, organizzata o registrata.
- Titolo estero: Una società può essere costituita in uno stato e registrata per operare in altri; tali registrazioni non devono essere deduplicate indiscriminatamente.
- Indirizzo legale e di notifica dell'agente: Utile per i servizi legali e per l'abbinamento dei dati, ma non come segnale di contatto commerciale.
- Accesso ai documenti: Alcuni stati offrono PDF gratuiti, altri applicano una tariffa per i documenti certificati o per gli ordini in blocco.
- Accesso in blocco/API: Disponibilità, tariffe, termini e ambito di applicazione variano da stato a stato.
- Aggiorna cadenza: Le relazioni annuali, le modifiche, gli scioglimenti e i reintegri sono flussi di eventi specifici di ogni stato.
Il modello pratico di CompaniesData dovrebbe trattare ogni registro statale come un'entità autorevole. I livelli federali come SEC, SAM.gov, USAspending, IRS TEOS, USPTO, OFAC e FinCEN aggiungono informazioni utili solo quando l'entità compare in quella specifica popolazione federale.
Strati federali: utili, solidi, ma non universali
- SEC EDGAR: Documenti depositati da società quotate e società soggette a obblighi di rendicontazione, dati XBRL e metadati per l'invio.
- SAM.gov: Entità registrate per gli appalti federali e relativi flussi di lavoro di esclusione/gestione delle entità.
- Spesa negli Stati Uniti: contratti, sovvenzioni, prestiti e altri dati relativi ai beneficiari di finanziamenti federali.
- IRS TEOS: Ricerca e download del contesto per le organizzazioni esenti da imposte.
- USPTO: marchi commerciali e altri segnali di titolarità/arricchimento della proprietà intellettuale.
- OFAC: Verifica delle parti soggette a restrizioni e delle sanzioni, non dei dati anagrafici aziendali.
- FinCEN BOI: La segnalazione della titolarità effettiva è soggetta a un regime di conformità limitato, non è una fonte pubblica di dati aperti.
Rivendicazioni ammesse e bloccate per l'articolo statunitense
Reclami accettati
- Gli Stati Uniti dispongono di solidi livelli federali aperti/API per i documenti depositati dalle società quotate in borsa, gli appaltatori federali, i finanziamenti federali, le organizzazioni esenti da imposte, la proprietà intellettuale e le sanzioni/conformità.
- La registrazione delle società private avviene principalmente a livello statale; non esiste un unico registro federale completo delle imprese equivalente a Companies House.
- SEC EDGAR, SAM.gov e USAspending sono fonti ufficiali, utili e compatibili con le API, ma si riferiscono a specifiche categorie di entità.
Richieste bloccate
- Non pretendo di avere un database ufficiale completo e gratuito per tutte le aziende statunitensi.
- Non considerare gli esempi di SEC, SAM.gov, USAspending o dei registri statali come un registro nazionale delle società private.
- Non si deve insinuare che le informazioni sulla titolarità effettiva di FinCEN siano pubbliche; l'accesso a BOI è limitato.
Pacchetto di risorse
Utilizzate questo pacchetto di risorse come guida per la verifica, la pianificazione dell'acquisizione e la valutazione del rischio delle fonti. I piccoli loghi delle fonti sono solo elementi decorativi che ne attestano la credibilità; l'autorevolezza deriva comunque dall'URL ufficiale, dal proprietario, dal modello di accesso e dalla nota di riutilizzo.
Registro e identità giuridica
Ricerca di aziende in California
Utilizzo: Esempio di stato ad alto volume per la verifica delle entità.
Guarda: Offerta valida solo in California; termini e campi variano a seconda dello stato.
Accesso tramite API, dati in blocco e dati aperti
API di gestione delle entità SAM.gov
Utilizzo: Ricerca programmatica di entità registrate su SAM.gov.
Guarda: L'accesso e i campi variano in base all'autorizzazione e alla sensibilità dei dati.Data.gov
Utilizzo: Livello di esplorazione per i set di dati federali, statali, locali e tribali.
Guarda: Catalogo, non l'autorità competente per ciascun registro statale.ricerca di entità del Delaware
Utilizzo: Esempio significativo di stato di incorporazione.
Guarda: La ricerca è specifica per ogni stato e non si basa su un'API nazionale completa.
Appalti e spesa pubblica
Informazioni sull'entità SAM.gov
Utilizzo: Contesto relativo agli appaltatori federali, alle registrazioni degli enti e alle esclusioni.
Guarda: La popolazione che si appalta agli enti federali, non l'intero universo delle imprese.API di spesa USA
Utilizzo: Beneficiari di premi, contratti, sovvenzioni e arricchimento della spesa federale.
Guarda: Avvocato premiato, non tutte le aziende statunitensi.
Proprietà intellettuale, marchi e beni immateriali
Ricerca di marchi registrati presso l'USPTO
Utilizzo: Titolare del marchio e valorizzazione del brand.
Guarda: Livello IP, non dati anagrafici aziendali.
Autorità di regolamentazione e conformità
API SEC EDGAR
Utilizzo: Contenuti depositati pubblicamente, dati aziendali, XBRL e informazioni aggiuntive sulle società quotate/obbligate a pubblicare i report.
Guarda: Vengono prese in considerazione solo le aziende che presentano i dati, non tutte le aziende statunitensi.data.sec.gov
Utilizzo: Dati e informazioni aziendali presentati alla SEC in formato leggibile da computer.
Guarda: Richiede intestazioni di accesso equo e frequenze di richiesta moderate.Risorse per sviluppatori della SEC
Utilizzo: Contesto tecnico e di utilizzo lecito per il consumo dei dati della SEC.
Guarda: Si tratta di un livello di politiche/linee guida piuttosto che di un registro delle imprese.API di estrazione di entità/esclusioni SAM
Utilizzo: Estratti di enti pubblici ed esclusioni per i flussi di lavoro di conformità.
Guarda: L'accesso a campi sensibili e a estratti non pubblici è limitato.Ricerca delle sanzioni OFAC
Utilizzo: Contesto relativo al controllo delle parti soggette a restrizioni e alla conformità normativa.
Guarda: Elenco di conformità, non registro delle imprese.FinCEN BOI
Utilizzo: Avvertenza sulla conformità relativa ai confini della titolarità effettiva.
Guarda: Le informazioni sulla titolarità effettiva non sono contenute in un database aziendale pubblico.
Ulteriori fonti di verifica
Ricerca di organizzazioni esenti da imposte secondo l'IRS
Utilizzo: Contesto relativo agli enti non profit e alle organizzazioni esenti da imposte.
Guarda: Solo organizzazioni esenti da imposte.
Analisi approfondite fonte per fonte
1.
API SEC EDGAR
Proprietario: autorità di regolamentazione. Accesso: https://www.sec.gov/edgar/sec-api-documentation.
- Cosa offre: documenti depositati pubblicamente, informazioni aziendali, XBRL e informazioni aggiuntive sulle società quotate/obbligate a pubblicare i report.
- Valore di riutilizzo: termini di accesso equo e del sito web della SEC
- Principale limitazione: solo le aziende che presentano i dati, non tutte le aziende statunitensi.
Le API EDGAR della SEC sono una fonte ufficiale di regolamentazione per gli Stati Uniti. Il loro principale valore pratico risiede nell'arricchimento dei dati relativi ai documenti depositati pubblicamente, alle informazioni aziendali, ai file XBRL e alle società quotate/obbligate a presentare report. L'accesso avviene tramite https://www.sec.gov/edgar/sec-api-documentation, pertanto la fonte deve essere utilizzata secondo tale modello di accesso, anziché essere considerata un flusso di dati illimitato.
Per il riutilizzo, la regola operativa è: accesso equo e termini del sito web della SEC. La limitazione principale è che si applicano solo alle società che presentano report, non a tutte le aziende statunitensi. In un flusso di lavoro normalizzato per i dati aziendali, questa fonte dovrebbe essere acquisita con provenienza, data di recupero, avvertenze a livello di campo e una chiara distinzione tra informazioni sull'entità legale, segnali di conformità ed eventuali arricchimenti successivi per marketing/contatti.
2.
data.sec.gov
Proprietario: autorità di regolamentazione. Accesso: https://data.sec.gov/.
- Cosa offre: Dati e informazioni sulle società depositate presso la SEC, leggibili automaticamente.
- Valore di riutilizzo: linee guida della SEC in materia di accesso equo e frequenza delle richieste.
- Principale limitazione: richiede intestazioni di accesso equo e frequenze di richiesta moderate.
data.sec.gov è una fonte ufficiale di informazioni regolamentate per gli Stati Uniti. Il suo principale valore pratico risiede nei dati relativi alle società e alle comunicazioni presentate alla SEC, consultabili automaticamente. L'accesso avviene tramite https://data.sec.gov/, pertanto la fonte deve essere considerata in base a tale modello di accesso, anziché come un flusso di dati illimitato.
Per il riutilizzo, la regola operativa è: linee guida SEC sull'accesso equo e sulla frequenza delle richieste. La limitazione principale è che richiede intestazioni di accesso equo e frequenze di richiesta moderate. In un flusso di lavoro normalizzato dei dati aziendali, questa fonte dovrebbe essere acquisita con provenienza, data di recupero, avvertenze a livello di campo e una chiara distinzione tra dati relativi all'entità legale, segnali di conformità ed eventuali arricchimenti successivi per marketing/contatti.
3.
Risorse per sviluppatori della SEC
Proprietario: autorità di regolamentazione. Accesso: https://www.sec.gov/about/developer-resources.
- Cosa offre: contesto tecnico e di utilizzo lecito per il consumo dei dati della SEC.
- Valore di riutilizzo: termini della SEC e politica di accesso equo
- Principale limitazione: Livello di politiche/linee guida anziché registro delle imprese.
SEC Developer Resources è una fonte ufficiale di informazioni regolamentate per gli Stati Uniti. Il suo principale valore pratico risiede nel contesto tecnico e legale per l'utilizzo dei dati della SEC. L'accesso avviene tramite https://www.sec.gov/about/developer-resources, pertanto la fonte deve essere trattata secondo tale modello di accesso, anziché essere considerata un flusso di dati illimitato.
Per il riutilizzo, la regola operativa è: termini SEC e politica di accesso equo. La limitazione principale è rappresentata dal livello di policy/linee guida anziché da un registro delle imprese. In un flusso di lavoro normalizzato per i dati aziendali, questa fonte dovrebbe essere acquisita con provenienza, data di recupero, avvertenze a livello di campo e una chiara distinzione tra dati relativi all'entità giuridica, segnali di conformità ed eventuali arricchimenti successivi per marketing/contatti.
4.
Informazioni sull'entità SAM.gov
Proprietario: Fonte ufficiale di appalto/ente federale. Accesso: https://sam.gov/content/entity-information.
- Cosa offre: contesto relativo agli appaltatori federali, alle registrazioni delle entità e alle esclusioni.
- Valore di riutilizzo: termini di SAM.gov e limiti FOIA/CUI
- Principale limitazione: la popolazione degli appalti federali, non l'intero universo aziendale.
SAM.gov Entity Information è una fonte ufficiale di informazioni sugli appalti e sulle entità federali degli Stati Uniti. Il suo principale valore pratico risiede nel contesto relativo agli appaltatori federali, alle registrazioni delle entità e alle esclusioni. L'accesso avviene tramite https://sam.gov/content/entity-information, pertanto la fonte deve essere trattata secondo tale modello di accesso, anziché essere considerata un flusso di dati illimitato.
Per il riutilizzo, la regola operativa è: termini SAM.gov e limiti FOIA/CUI. La limitazione principale è rappresentata dalla popolazione degli appalti federali, non dall'intero universo aziendale. In un flusso di lavoro normalizzato per i dati aziendali, questa fonte dovrebbe essere acquisita con provenienza, data di recupero, avvertenze a livello di campo e una chiara distinzione tra dati relativi all'entità giuridica, segnali di conformità ed eventuali arricchimenti successivi per marketing/contatti.
5.
API di gestione delle entità SAM.gov
Proprietario: API ufficiale della GSA. Accesso: https://open.gsa.gov/api/entity-api/.
- Cosa offre: Ricerca programmatica di entità registrate su SAM.gov.
- Valore di riutilizzo: termini API GSA/SAM e restrizioni CUI
- Principale limitazione: l'accesso e i campi variano in base all'autorizzazione e alla sensibilità dei dati.
L'API SAM.gov Entity Management è una fonte API ufficiale della GSA per gli Stati Uniti. Il suo principale vantaggio pratico è la ricerca programmatica di entità registrate su SAM.gov. L'accesso avviene tramite https://open.gsa.gov/api/entity-api/, pertanto la fonte deve essere gestita secondo tale modello di accesso, anziché essere considerata un flusso di dati illimitato.
Per il riutilizzo, la regola operativa è: termini API GSA/SAM e restrizioni CUI. La limitazione principale è che l'accesso e i campi variano in base all'autorizzazione e alla sensibilità dei dati. In un flusso di lavoro normalizzato dei dati aziendali, questa fonte dovrebbe essere acquisita con provenienza, data di recupero, avvertenze a livello di campo e una chiara distinzione tra dati relativi all'entità legale, segnali di conformità ed eventuali arricchimenti successivi per marketing/contatti.
6.
API di estrazione di entità/esclusioni SAM
Proprietario: API ufficiale della GSA. Accesso: https://open.gsa.gov/api/sam-entity-extracts-api/.
- Cosa offre: Estratti di entità pubbliche ed esclusioni per i flussi di lavoro di conformità.
- Valore di riutilizzo: limiti di estrazione pubblica/FOIA e CUI
- Principale limitazione: l'accesso ai campi sensibili e agli estratti non pubblici è limitato.
SAM Entity/Exclusions Extract APIs è una fonte API ufficiale della GSA per gli Stati Uniti. Il suo principale valore pratico risiede nell'estrazione di dati relativi a entità pubbliche ed esclusioni per i flussi di lavoro di conformità. L'accesso avviene tramite https://open.gsa.gov/api/sam-entity-extracts-api/, pertanto la fonte deve essere gestita secondo tale modello di accesso, anziché essere considerata un flusso di dati illimitato.
Per il riutilizzo, la regola operativa è: limiti FOIA/estratto pubblico e CUI. La limitazione principale è che i campi sensibili e gli estratti non pubblici sono soggetti a restrizioni. In un flusso di lavoro normalizzato per i dati aziendali, questa fonte dovrebbe essere acquisita con provenienza, data di recupero, avvertenze a livello di campo e una chiara distinzione tra dati relativi all'entità legale, segnali di conformità ed eventuali arricchimenti successivi per marketing/contatti.
7.
API di spesa USA
Proprietario: Dati aperti ufficiali federali. Accesso: https://api.usaspending.gov/docs/.
- Cosa offre: beneficiari di premi, contratti, sovvenzioni e arricchimento della spesa federale.
- Valore di riutilizzo: termini relativi alla spesa pubblica statunitense/dati federali pubblici
- Principale limitazione: Livello dei beneficiari del premio, non tutte le aziende statunitensi.
L'API USAspending è una fonte ufficiale di dati aperti a livello federale per gli Stati Uniti. Il suo principale valore pratico risiede nell'arricchimento delle informazioni relative a beneficiari di premi, contratti, sovvenzioni e spesa federale. L'accesso avviene tramite https://api.usaspending.gov/docs/, pertanto la fonte deve essere trattata secondo tale modello di accesso, anziché essere considerata un flusso di dati illimitato.
Per il riutilizzo, la regola operativa è: termini USAspending/dati federali pubblici. La limitazione principale è rappresentata dal livello dei beneficiari dei premi, non da tutte le aziende statunitensi. In un flusso di lavoro normalizzato dei dati aziendali, questa fonte dovrebbe essere acquisita con provenienza, data di recupero, avvertenze a livello di campo e una chiara distinzione tra informazioni sull'entità legale, segnali di conformità ed eventuali arricchimenti successivi per marketing/contatti.
8.
Data.gov
Proprietario: Dati aperti ufficiali. Accesso: https://catalog.data.gov/.
- Cosa offre: Livello di esplorazione per set di dati federali, statali, locali e tribali.
- Valore di riutilizzo: termini specifici del governo statunitense relativi al set di dati
- Principale limitazione: il catalogo, non l'autorità competente per ciascun registro statale.
Data.gov è una fonte ufficiale di dati aperti per gli Stati Uniti. Il suo principale valore pratico risiede nel livello di scoperta per i dataset federali, statali, locali e tribali. L'accesso avviene tramite https://catalog.data.gov/, pertanto la fonte dovrebbe essere trattata secondo tale modello di accesso, anziché essere considerata un flusso di dati illimitato.
Per il riutilizzo, la regola operativa è: termini specifici del governo statunitense per ciascun dataset. La limitazione principale è rappresentata dal Catalogo, non dall'autorità di ciascun registro statale. In un flusso di lavoro normalizzato per i dati aziendali, questa fonte dovrebbe essere acquisita con provenienza, data di recupero, avvertenze a livello di campo e una chiara distinzione tra informazioni relative all'entità giuridica, segnali di conformità ed eventuali arricchimenti successivi per marketing/contatti.
9.
Ricerca di aziende in California
Proprietario: registro ufficiale statale. Accesso: https://bizfileonline.sos.ca.gov/search/business.
- Cosa offre: Esempio di stato ad alto volume per la verifica delle entità.
- Valore di riutilizzo: termini del Segretario di Stato della California
- Principale limitazione: valido solo in California; termini e campi variano a seconda dello stato.
California Business Search è una fonte ufficiale di registri statali per gli Stati Uniti. Il suo principale valore pratico è la possibilità di ottenere un elevato volume di dati statali per la verifica delle entità. L'accesso avviene tramite https://bizfileonline.sos.ca.gov/search/business, pertanto la fonte deve essere utilizzata secondo tale modello di accesso, anziché essere considerata un flusso di dati illimitato.
Per il riutilizzo, la regola operativa è: termini del Segretario di Stato della California. La limitazione principale è che si applica solo alla California; termini e campi variano da stato a stato. In un flusso di lavoro normalizzato per i dati aziendali, questa fonte dovrebbe essere acquisita con provenienza, data di recupero, avvertenze a livello di campo e una chiara distinzione tra informazioni sull'entità legale, segnali di conformità ed eventuali arricchimenti successivi per marketing/contatti.
10
ricerca di entità del Delaware
Proprietario: registro ufficiale statale. Accesso: https://icis.corp.delaware.gov/Ecorp/EntitySearch/NameSearch.aspx.
- Cosa offre: Un importante esempio di stato di incorporazione.
- Valore di riutilizzo: termini della Divisione delle Società del Delaware
- Principale limitazione: la ricerca è specifica per ogni stato e non si basa su un'API nazionale completa.
La ricerca di entità del Delaware è una fonte ufficiale del registro statale degli Stati Uniti. Il suo principale valore pratico è quello di fornire un importante esempio di stato di costituzione societaria. L'accesso avviene tramite https://icis.corp.delaware.gov/Ecorp/EntitySearch/NameSearch.aspx, pertanto la fonte dovrebbe essere trattata secondo tale modello di accesso, anziché essere considerata un flusso di dati illimitato.
Per il riutilizzo, la regola operativa è: termini della Divisione delle Società del Delaware. La limitazione principale è che la ricerca è specifica per stato e non è un'API nazionale completa. In un flusso di lavoro normalizzato dei dati aziendali, questa fonte dovrebbe essere acquisita con provenienza, data di recupero, avvertenze a livello di campo e una chiara distinzione tra informazioni sull'entità legale, segnali di conformità ed eventuali arricchimenti successivi per marketing/contatti.
Opzioni pratiche
Percorso ufficiale per dati aperti o API
Iniziate con la giurisdizione di costituzione o di qualificazione per le società private, quindi aggiungete i livelli federali solo quando l'entità appartiene a tale categoria: SEC EDGAR per le società soggette a obblighi di informativa, SAM.gov per la registrazione negli appalti federali, USAspending per i finanziamenti, IRS TEOS per le organizzazioni esenti da imposte, USPTO per i marchi e OFAC per il controllo delle parti soggette a restrizioni.
Per l'utilizzo in produzione, considerate questo percorso come un piano di acquisizione dati piuttosto che come un singolo download. Iniziate con il registro ufficiale o il catalogo dati, conservate le istantanee delle fonti originali, registrate i termini di accesso, quindi aggiungete le fonti di arricchimento una alla volta con la provenienza a livello di campo.
Verifica manuale e percorso documentale
Alcuni paesi divulgano informazioni aziendali importanti tramite certificati, documenti in formato PDF, avvisi pubblicati nella Gazzetta Ufficiale, estratti a pagamento o servizi a pagamento. Queste fonti possono essere preziose, ma devono essere documentate come flussi di lavoro controllati. Non descrivetele come API aperte o set di dati di massa a meno che l'autorità non pubblichi chiaramente tale modello di accesso.
Percorso dati di contatto e lista di marketing
Per le attività di contatto commerciale, i dati di identità aziendale rappresentano solo il primo livello. Indirizzi email aziendali, numeri di telefono, ruoli dei contatti, logica di esclusione e segmentazione richiedono un processo di gestione dei dati di contatto separato e conforme alle normative. Tale livello deve essere documentato separatamente dal riutilizzo dei dati presenti nei registri ufficiali.
Rapporti privati e prodotti di rischio
I fornitori di report aziendali privati possono essere utili per la due diligence manuale negli Stati Uniti, ma l'obiettivo editoriale di questo articolo non è quello di creare un elenco di concorrenti. Il valore strategico risiede nella comprensione di quali fonti ufficiali esistono e dove è necessaria una normalizzazione.
Se un utente necessita di record aziendali pronti per il CRM, la soluzione più pratica è combinare la provenienza da fonti ufficiali con l'arricchimento, la deduplicazione, i controlli di qualità e le verifiche di conformità legale. Questo è diverso dall'acquisto di un elenco di lead generico: il livello delle fonti ufficiali spiega cosa può essere verificato, mentre il livello del dataset commerciale spiega come i record possono essere utilizzati a livello operativo.
Cosa manca nei dati aperti ufficiali?
- Non si dichiara di possedere un database completo e gratuito di aziende statunitensi ufficiali.
- I registri statali sono autorità indipendenti con ambiti, tariffe, API, modalità di accesso ai documenti, cicli di aggiornamento e termini di riutilizzo differenti.
- Il sistema EDGAR della SEC si applica alle società e ai documenti che devono essere presentati, non a tutte le LLC, società per azioni, società di persone o ditte individuali private.
- SAM.gov e USAspending coprono gli appalti/enti federali e le relative aggiudicazioni, non l'intero universo delle imprese.
- Le informazioni sulla titolarità effettiva fornite da FinCEN sono dati riservati relativi alla conformità normativa e non costituiscono un set di dati aziendale pubblico.
- I dati conservati presso la Segreteria di Stato, gli indirizzi degli agenti registrati, i contatti per gli appalti, i campi relativi ai funzionari e i dati relativi alle persone esenti da imposte non costituiscono consenso per i contatti di marketing.
- Una fornitura commerciale di dati aziendali deve mantenere separati i campi relativi all'identità aziendale, alla provenienza da fonti ufficiali, all'arricchimento dei dati e ai dati di contatto.
Ecco perché i prodotti basati sui dati aziendali spesso aggiungono valore anche quando le fonti pubbliche sottostanti sono affidabili: i dati ufficiali sono spesso frammentati tra diverse autorità, formati, lingue, identificativi e modelli di accesso.
I dati mancanti devono essere gestiti esplicitamente nella progettazione del dataset. Se una fonte ufficiale non consente il download in blocco, CompaniesData non deve fingere che il file di download in blocco esista; deve invece registrare la limitazione della fonte, aggiungere arricchimenti ufficiali alternativi laddove consentito dalla legge ed esporre i campi di attendibilità in modo che gli utenti sappiano quali attributi provengono da quale livello.
Modello dati consigliato
Un modello pratico in stile CompaniesData per gli Stati Uniti dovrebbe mantenere separati i campi relativi alle prove di origine e all'uso commerciale. La tabella principale dovrebbe contenere l'identità dell'entità giuridica, lo stato, gli identificativi di registrazione, la forma giuridica, la giurisdizione, l'indirizzo registrato e le date di origine. Tabelle di arricchimento separate possono quindi memorizzare gli appalti, le risorse di proprietà intellettuale, lo stato regolamentare, i segnali delle società quotate, le corrispondenze LEI, i riscontri di sanzioni/conformità e il contesto del settore statistico.
- Identità dell'entità: nome legale, nome normalizzato, numero di registrazione, giurisdizione, forma giuridica e stato del ciclo di vita.
- Provenienza della fonte: URL della fonte, autorità, data di recupero, metodo di accesso, nota sulla licenza/riutilizzo e indicatore di affidabilità.
- Cronologia degli eventi: costituzione, modifiche, depositi, avvisi nella Gazzetta Ufficiale, insolvenza o scioglimento laddove legalmente pubblici.
- Arricchimento: livelli relativi ad appalti, proprietà intellettuale, autorità di regolamentazione, scambio, LEI e statistiche ufficiali con le proprie date di origine.
- Consegna commerciale: esportazioni pronte per il CRM, segmentazione e campi dati di contatto solo in presenza di una base giuridica separata e di un flusso di lavoro di esclusione.
Come CompaniesData aggiunge valore
Per gli Stati Uniti, il ruolo di CompaniesData è quello di trasformare materiale di origine frammentato in un dataset aziendale utilizzabile: nomi delle aziende normalizzati, entità deduplicate, campi relativi a paese e attività coerenti, provenienza delle fonti, tracciamento degli aggiornamenti e funzionalità di arricchimento.
- Normalizzare gli identificativi di registro e i nomi legali.
- Confrontare i dati ufficiali dell'azienda con i segnali relativi ad appalti, proprietà intellettuale, LEI e autorità di regolamentazione.
- Contrassegna la provenienza della fonte in modo che ogni profilo derivato possa essere verificato.
- Separare l'identità aziendale dai dati di contatto e dalle autorizzazioni di marketing.
- Raggruppa i dati per l'analisi, l'arricchimento del CRM e le ricerche di mercato, invece di costringere gli utenti ad analizzare manualmente i portali.
Per gli Stati Uniti, il valore editoriale di CompaniesData non risiede nell'affermare che ogni record sia aperto o che ogni campo possa essere riutilizzato senza condizioni. Il valore è l'opposto: rendere visibili i confini delle fonti, normalizzare i record disordinati, aggiungere informazioni di arricchimento interpretabili e fornire un dataset che gli utenti possano verificare, anziché una raccolta dati anonima.
Richiedi un campione di dati aziendali per gli Stati Uniti se hai bisogno di un set di dati pratico anziché di un elenco di portali di origine.
Confine tra set di dati commerciali e dati di contatto
L'articolo statunitense sull'accesso aperto ai dati aziendali sostiene la proposta di vendita dei database aziendali, ma non deve confondere i registri ufficiali con le liste di marketing. Un documento depositato presso la Segreteria di Stato, un documento depositato presso la SEC, una registrazione SAM, un registro dei beneficiari di premi, un registro dei titolari di marchi o una voce in una lista di sanzioni possono aiutare a verificare l'identità di un'azienda. Tuttavia, ciò non autorizza a inviare e-mail o telefonare a tale azienda.
- Livello di identità aziendale: Denominazioni legali, codici identificativi statali, giurisdizione, stato, campi relativi all'agente registrato e date di origine.
- Strato di arricchimento: SEC CIK, SAM UEI, ID dei destinatari di USAspending, proprietari USPTO, riscontri OFAC e corrispondenze LEI laddove consentito dalla legge.
- Livello dati di contatto: La segmentazione relativa a email aziendali, numeri di telefono, ruoli, esclusione e contatti richiede un flusso di lavoro separato basato su una base giuridica tramite CompaniesData.cloud.
- Acquirenti di lingua spagnola: Le richieste di dati di contatto possono essere indirizzate a CentraldeComunicacion.es anziché a fornitori di dati di contatto terzi concorrenti.
Matrice sorgente
| Fonte | Proprietario | Ciò che dà | Riutilizzare il valore | Limiti |
|---|---|---|---|---|
| regolatore ufficiale | Contenuti depositati pubblicamente, dati aziendali, XBRL e informazioni aggiuntive sulle società quotate/obbligate a pubblicare i report. | Termini di accesso equo e del sito web della SEC | Vengono prese in considerazione solo le aziende che presentano i dati, non tutte le aziende statunitensi. | |
| regolatore ufficiale | Dati e informazioni aziendali presentati alla SEC in formato leggibile da computer. | Linee guida della SEC in materia di accesso equo e tassi di richiesta | Richiede intestazioni di accesso equo e frequenze di richiesta moderate. | |
| regolatore ufficiale | Contesto tecnico e di utilizzo lecito per il consumo dei dati della SEC. | Termini e politica di accesso equo della SEC | Si tratta di un livello di politiche/linee guida piuttosto che di un registro delle imprese. | |
| fonte ufficiale di appalti/enti federali | Contesto relativo agli appaltatori federali, alle registrazioni degli enti e alle esclusioni. | Termini di SAM.gov e limiti FOIA/CUI | La popolazione che si appalta agli enti federali, non l'intero universo delle imprese. | |
| API ufficiale della GSA | Ricerca programmatica di entità registrate su SAM.gov. | Termini API GSA/SAM e restrizioni CUI | L'accesso e i campi variano in base all'autorizzazione e alla sensibilità dei dati. | |
| API ufficiale della GSA | Estratti di enti pubblici ed esclusioni per i flussi di lavoro di conformità. | Confini FOIA/estratto pubblico e CUI | L'accesso a campi sensibili e a estratti non pubblici è limitato. | |
| dati aperti ufficiali federali | Beneficiari di premi, contratti, sovvenzioni e arricchimento della spesa federale. | Termini relativi alla spesa pubblica negli Stati Uniti/dati federali pubblici | Avvocato premiato, non tutte le aziende statunitensi. | |
| dati aperti ufficiali | Livello di esplorazione per i set di dati federali, statali, locali e tribali. | termini specifici del set di dati del governo statunitense | Catalogo, non l'autorità competente per ciascun registro statale. | |
| registro ufficiale dello stato | Esempio di stato ad alto volume per la verifica delle entità. | Mandato del Segretario di Stato della California | Offerta valida solo in California; termini e campi variano a seconda dello stato. | |
| registro ufficiale dello stato | Esempio significativo di stato di incorporazione. | Termini della Divisione delle Società del Delaware | La ricerca è specifica per ogni stato e non si basa su un'API nazionale completa. | |
| autorità fiscale ufficiale | Contesto relativo agli enti non profit e alle organizzazioni esenti da imposte. | termini di informazione pubblica dell'IRS | Solo organizzazioni esenti da imposte. | |
| autorità ufficiale in materia di proprietà intellettuale | Titolare del marchio e valorizzazione del brand. | Termini e avvisi specifici del set di dati dell'USPTO | Livello IP, non dati anagrafici aziendali. | |
| autorità ufficiale sanzionatoria | Contesto relativo al controllo delle parti soggette a restrizioni e alla conformità normativa. | Termini del Tesoro degli Stati Uniti | Elenco di conformità, non registro delle imprese. | |
| autorità ufficiale per i reati finanziari | Avvertenza sulla conformità relativa ai confini della titolarità effettiva. | riservato; non dati aperti al pubblico | Le informazioni sulla titolarità effettiva non sono contenute in un database aziendale pubblico. |
Gli Stati Uniti sono economicamente essenziali ma strutturalmente decentralizzati. Esistono solidi livelli API/di gestione centralizzata per le società quotate in borsa, gli appaltatori federali, i finanziamenti federali, le organizzazioni esenti da imposte, i marchi e le sanzioni/conformità. La costituzione di società private è di competenza statale, pertanto qualsiasi articolo deve innanzitutto evidenziare l'assenza di un registro nazionale unico per le società private e spiegare le diverse normative a livello statale.
FAQ
Esiste un unico database ufficiale e gratuito di aziende che effettuano acquisti all'ingrosso negli Stati Uniti?
Non sempre. Gli Stati Uniti dispongono di fonti ufficiali di dati aziendali, ma l'accesso in blocco, l'accesso tramite API, le estrazioni a pagamento e la ricerca sul web possono essere prodotti separati. Non dare per scontato che un file di dati in blocco completo sia gratuito a meno che la fonte specifica non lo dimostri.
Qual è la migliore fonte iniziale di dati sulle aziende statunitensi?
La migliore fonte iniziale per verificare l'esistenza legale delle società private è rappresentata dai registri statali delle imprese, dal database EDGAR della SEC per le società soggette a obblighi di rendicontazione, da SAM.gov e USAspending per gli appaltatori federali e i beneficiari di sovvenzioni, dai dati dell'IRS sulle organizzazioni esenti da imposte, dai dati sui marchi registrati dell'USPTO, dal controllo delle sanzioni dell'OFAC e dal FinCEN BOI come limite di conformità non pubblico e ristretto. Queste informazioni dovrebbero poi essere integrate con statistiche, appalti, proprietà intellettuale e fonti normative.
È possibile riutilizzare a fini commerciali i dati di società quotate in borsa?
Spesso sì, ma solo alle condizioni specifiche della fonte. Possono essere applicati obblighi di attribuzione, conservazione della data di aggiornamento, divieti di approvazione e controlli previsti dal GDPR.
Posso utilizzare i dati del registro per il marketing via email a freddo?
L'accesso ai registri pubblici non fornisce alcuna conclusione automatica. Le attività di marketing richiedono una base giuridica separata, una gestione specifica per l'esclusione delle richieste e una verifica della conformità dei dati di contatto.
Perché utilizzare CompaniesData invece di raccogliere manualmente fonti negli Stati Uniti?
La raccolta manuale è lenta perché identificatori, formati, lingue e copertura variano a seconda della fonte. CompaniesData aggiunge normalizzazione, corrispondenza, deduplicazione, tracciabilità e formati di consegna pratici.
Con quale frequenza è necessario aggiornare i dati delle aziende statunitensi?
La frequenza di aggiornamento dipende dalla fonte. Le ricerche nei registri e le API possono supportare controlli frequenti, mentre le gazzette ufficiali, i portali degli appalti, le pubblicazioni statistiche e gli estratti a pagamento possono aggiornarsi con tempistiche diverse. Un set di dati affidabile dovrebbe memorizzare le date di recupero e le note di aggiornamento specifiche per ciascuna fonte.
Cosa bisogna verificare prima di pubblicare o vendere un dataset arricchito?
Verificare l'autorità della fonte, i termini della licenza, l'esposizione dei dati personali, la base giuridica dei dati di contatto, la provenienza dei dati, le regole di esclusione, le date di aggiornamento e se qualche fonte ufficiale vieta il riutilizzo o la rivendita automatizzata.
fonti
API SEC EDGAR – autorità di regolamentazione
data.sec.gov – autorità di regolamentazione
Risorse per sviluppatori della SEC – autorità di regolamentazione
Informazioni sull'entità SAM.gov – fonte ufficiale di appalti/enti federali
API di gestione delle entità SAM.gov – API ufficiale della GSA
API di estrazione di entità/esclusioni SAM – API ufficiale della GSA
API di spesa USA – dati aperti ufficiali federali
Data.gov – dati aperti ufficiali
Ricerca di aziende in California – registro ufficiale dello stato
ricerca di entità del Delaware – registro ufficiale dello stato
Ricerca di organizzazioni esenti da imposte secondo l'IRS – autorità fiscale ufficiale
Ricerca di marchi registrati presso l'USPTO – autorità ufficiale in materia di proprietà intellettuale
Ricerca delle sanzioni OFAC – autorità ufficiale preposta alle sanzioni
FinCEN BOI – autorità ufficiale per i reati finanziari
Lascia un Commento
Vuoi partecipare alla discussione?Sentitevi liberi di contribuire!