بيانات الشركات المفتوحة في الولايات المتحدة: المصادر الرسمية، وواجهات برمجة التطبيقات، وحقوق إعادة الاستخدام
تمتلك الولايات المتحدة منظومة بيانات رسمية متينة للشركات، لكن لا ينبغي اختزالها إلى مجرد قائمة بالشركات. إن الطريقة المثلى لتقييم الولايات المتحدة هي البدء بالسجل الرسمي، ثم إضافة البيانات المفتوحة، والإحصاءات، والمشتريات، والملكية الفكرية، والجهات التنظيمية.
يُعدّ استخدام سجلات الشركات الحكومية للتحقق من الوجود القانوني للشركات الخاصة، ونظام EDGAR التابع لهيئة الأوراق المالية والبورصات الأمريكية (SEC) للشركات المُبلِّغة، وموقع SAM.gov وموقع USAspending للمقاولين الفيدراليين والمتلقين للمنح، وبيانات المنظمات المعفاة من الضرائب الصادرة عن مصلحة الضرائب الأمريكية (IRS)، وبيانات العلامات التجارية الصادرة عن مكتب براءات الاختراع والعلامات التجارية الأمريكي (USPTO)، وفحص عقوبات مكتب مراقبة الأصول الأجنبية (OFAC)، وشبكة مكافحة الجرائم المالية (FinCEN) كحدود امتثال غير عامة ومقيدة. هذا يجعل الولايات المتحدة خريطة مصادر لامركزية على المستويين الفيدرالي والولائي، وليست سجلاً وطنياً موحداً للشركات، ولكنه لا يُلغي عمليات التحقق المعتادة لإعادة الاستخدام: شروط مجموعة البيانات، والإسناد، ولغة عدم التأييد، والخصوصية، وحدود قوانين التسويق، وحداثة المصدر.
يرسم هذا الدليل خريطة للمصادر الرسمية الرئيسية لبيانات الشركات في الولايات المتحدة، ويشرح ما يمكن لكل مصدر فعله وما لا يمكنه فعله، ويوضح أين تضيف مجموعة البيانات الموحدة على نمط CompaniesData قيمة.
السؤال الأعمق ليس ما إذا كان المصدر موجوداً أم لا. السؤال المفيد هو أي مصدر يمكن الوثوق به للتحقق من الهوية، وأي مصدر يثبت الأحداث أو الملفات، وأي مصدر قابل للاستخدام على نطاق واسع، وأي مصدر هو مجرد خدمة يدوية، وأي الحقول تصبح حساسة قانونياً بمجرد إعادة استخدام البيانات تجارياً.
جواب سريع
لا يمكن نشر بيانات الولايات المتحدة إلا كدليل رسمي لامركزي. وتُعدّ واجهات برمجة التطبيقات الفيدرالية ومجموعات البيانات الضخمة أدوات قوية للشركات التي تقدم تقاريرها إلى هيئة الأوراق المالية والبورصات، والمتعاقدين الفيدراليين، والمتلقين للمنح الفيدرالية، والمنظمات المعفاة من الضرائب، والعلامات التجارية، وفحص العقوبات، إلا أن تسجيل الشركات الخاصة يتم على مستوى الولايات، ولا يوجد سجل فيدرالي عام شامل للشركات.
بالنسبة للعمل العملي، فإن مجموعة المصادر الأكثر فائدة هي: واجهات برمجة تطبيقات SEC EDGAR، و data.sec.gov، وموارد مطوري SEC، ومعلومات كيانات SAM.gov، وواجهة برمجة تطبيقات إدارة كيانات SAM.gov، وواجهات برمجة تطبيقات استخراج كيانات/استثناءات SAM.
الجواب التحريري الآمن هو التالي: تمتلك الولايات المتحدة مصادر بيانات أعمال عامة ورسمية قوية، لكن البيانات العامة ليست قابلة للتنزيل بكميات كبيرة تلقائيًا، أو جاهزة للتسويق، أو خالية من قيود البيانات الشخصية.
تحتاج مجموعة بيانات الولايات المتحدة الجادة عادةً إلى أربع طبقات على الأقل: السجل القانوني لهوية الكيان، والمنشورات الرسمية أو الملفات الخاصة بأحداث التغيير، ومصادر المشتريات العامة/الجهات التنظيمية/الملكية الفكرية/الإحصائية للإثراء، وطبقة امتثال منفصلة للخصوصية، واستخدام بيانات الاتصال، والحجب، والتواصل القانوني.
الوجبات السريعة الرئيسية
- أفضل نقطة بداية: سجلات الأعمال الحكومية للوجود القانوني للشركات الخاصة، ونظام SEC EDGAR للشركات المبلغة، وموقع SAM.gov وموقع USAspending للمقاولين الفيدراليين والمتلقين للجوائز، وبيانات المنظمات المعفاة من الضرائب التابعة لمصلحة الضرائب الأمريكية، وبيانات العلامات التجارية التابعة لمكتب براءات الاختراع والعلامات التجارية الأمريكي، وفحص عقوبات مكتب مراقبة الأصول الأجنبية، وشبكة مكافحة الجرائم المالية (FinCEN) كحدود امتثال غير عامة مقيدة.
- مجموعة المصادر الأساسية: واجهات برمجة تطبيقات SEC EDGAR، data.sec.gov، موارد مطوري SEC، معلومات كيانات SAM.gov، واجهة برمجة تطبيقات إدارة كيانات SAM.gov، واجهات برمجة تطبيقات استخراج كيانات/استثناءات SAM.
- قاعدة إعادة الاستخدام: لا يُعدّ الظهور العام بمثابة إعادة استخدام بكميات كبيرة، أو إذن إعادة البيع، أو إذن الاتصال بالتسويق.
- قيمة المشتري: إن مجموعة البيانات المفيدة هي النسخة الموحدة والمُزالة منها البيانات المكررة والقابلة للتدقيق من المصدر، وليست قائمة خام لروابط البوابة.
- الفصل التجاري: ينبغي أن تبقى سجلات الشركة الرسمية وملفات تعريف الشركة المحسّنة وبيانات الاتصال التجاري طبقات منفصلة مع ملاحظات امتثال منفصلة.
منهجية التحرير
تعتمد هذه المقالة على منهجية المصادر الرسمية أولاً. وتُدرج المصادر عندما تُساعد في التحقق من الوجود القانوني، أو الإفصاحات العامة، أو أنشطة الشراء، أو سياق دافع الضرائب أو المعرّف، أو ملكية الملكية الفكرية، أو الوضع التنظيمي، أو الإحصاءات، أو سياق الامتثال القانوني. ولا تُستخدم مزودات الخدمات التجارية ومنتجات بيانات الاتصال كسلطة لحقوق إعادة الاستخدام الرسمية.
- يفضل الرجوع إلى السجل الوطني أو سجل الشركات أو الجريدة الرسمية أو هيئة تسجيل الأعمال الرسمية قبل أي مصدر ثانوي.
- صنّف الوصول إلى البحث، أو واجهة برمجة التطبيقات، أو التنزيل المجمع، أو الاستخراج المدفوع، أو الاشتراك، أو سير عمل المستندات، أو فهرس البيانات، أو الوصول غير الواضح/اليدوي.
- افصل بيانات الكيانات القانونية عن إحصاءات المنشأة، وموردي المشتريات، وإفصاحات الشركات المدرجة، ومعرفات الضرائب، وبيانات الاتصال الخاصة.
- تعامل مع المالكين المستفيدين والمسؤولين والعناوين والتوقيعات وإشعارات الإعسار وسجلات التاجر الفردي على أنها حساسة للخصوصية ما لم يدعم المصدر والقانون بوضوح إعادة استخدامها.
- قم بإيقاف أو حذف روابط المصدر غير المستقرة عندما يُظهر اختبار الجودة المباشر سلوك 403 أو 429 أو 5xx أو DNS أو TLS أو مهلة زمنية من شأنها أن تُسبب ضوضاء الروابط المعطلة.
ما الذي يُعتبر بيانات شركة في الولايات المتحدة؟
| طبقة | أمثلة | الاستخدام التجاري النموذجي |
|---|---|---|
| هوية السجل | الاسم القانوني، رقم التسجيل، الحالة، الشكل القانوني، المكتب المسجل | مطابقة الكيانات، وإزالة التكرارات، ومعرفة العميل |
| تسجيل الفعاليات | التأسيس، التغييرات، الملفات، المقتطفات، المنشورات | الجدول الزمني للشركة وإمكانية التتبع القانوني |
| طبقة البيانات المفتوحة/واجهة برمجة التطبيقات | مجموعات البيانات الرسمية، وواجهات برمجة التطبيقات، وخدمات CSV/JSON/XML حيثما توفرت | الاستيعاب والمراقبة الآلية |
| تثبت الإحصائيات | التركيبة السكانية للأعمال، وعدد الشركات، وإجمالي القطاعات/المناطق الجغرافية | تحديد حجم السوق ومعايير جودة البيانات |
| المشتريات | المناقصات، والجوائز، والموردين، وسلطات التعاقد | معلومات مبيعات القطاع العام |
| الملكية الفكرية والهيئات التنظيمية | العلامات التجارية، وبراءات الاختراع، والكيانات الخاضعة للإشراف، والقرارات | الإثراء وفحص الامتثال |
| بيانات الاتصال | البريد الإلكتروني، الهاتف، أدوار جهات الاتصال والتجزئة | التسويق فقط على أساس قانوني منفصل |
في الولايات المتحدة، لا ينبغي دمج هذه الطبقات في قاعدة بيانات واحدة غير متمايزة. فقد تثبت نتيجة التسجيل وجودًا قانونيًا، وقد يثبت إشعار الشراء نشاطًا في القطاع العام، وقد يثبت سجل الملكية الفكرية ملكية العلامة التجارية أو الاختراع، وقد تثبت قائمة الجهات التنظيمية الإشراف. هذه حقائق مختلفة ذات دورات تحديث ومعرفات وحدود إعادة استخدام مختلفة.
حقوق إعادة الاستخدام والامتثال
في مختلف الأنظمة القضائية، يمكن لسياسات المعلومات العامة والبيانات المفتوحة أن تدعم إعادة استخدام بيانات القطاع العام، وتُعامل قواعد مجموعات البيانات عالية القيمة بيانات الشركات وملكية الشركات بشكل متزايد على أنها معلومات عامة مهمة. عمليًا، لا يزال موقف الولايات المتحدة الفعلي من إعادة الاستخدام يعتمد على كل مصدر ونقطة نهاية وترخيص وطريقة وصول.
- اذكر المصادر الرسمية واحتفظ بتواريخ التحديث حيثما توفرها المصادر.
- لا تلمح إلى أن مجموعة البيانات المشتقة معتمدة من قبل السجل أو السلطة العامة.
- لا تخلط بيانات السجل العام مع إذن الاتصال التسويقي.
- تحقق مما إذا كانت شروط الوصول إلى واجهة برمجة التطبيقات (API) والتنزيل المجمع والاستخراج المدفوع والبحث عبر الويب مختلفة.
- تعامل مع بيانات الموظفين والمالكين المستفيدين والأشخاص الطبيعيين على أنها حساسة للائحة العامة لحماية البيانات (GDPR) عند الاقتضاء.
لا يمكن نشرها إلا كخريطة رسمية لامركزية؛ وليس كسجل وطني على غرار سجل الشركات
تغطية المخاطر، والوصول إليها، وتحديثها
الخطأ الأكثر شيوعًا في مجال بيانات الشركات في الولايات المتحدة هو الخلط بين وضوح البيانات واكتمالها. قد تكون شاشة البحث العامة موثوقة للبحث عن كيان واحد، لكنها غير مناسبة لمعالجة كميات كبيرة من البيانات. يمكن إعادة استخدام مجموعة البيانات القابلة للتنزيل لعرض بيانات محددة، مع استبعاد الملفات والوثائق والمديرين والكيانات غير النشطة والتغييرات التاريخية.
- التغطية: تحديد ما إذا كان المصدر يغطي الشركات، أو الأسماء التجارية، أو الفروع، أو المنظمات غير الربحية، أو التجار الأفراد، أو الجهات المصدرة المدرجة، أو الكيانات الخاضعة للتنظيم، أو مجموعة فرعية من القطاع فقط.
- الحداثة: الحفاظ على تاريخ تحديث المصدر وتجنب خلط نتائج البوابة المباشرة مع الملفات القديمة التي تم تنزيلها بدون تسميات الإصدار.
- المعرفات: يتم تعيين أرقام تسجيل الخرائط، ومعرفات الضرائب، ومعرفات موردي المشتريات، وسجلات LEI، ورموز البورصة كمفاتيح منفصلة حتى يتم التحقق منها.
- اللغة والتنسيقات: يجب توحيد أسماء اللغات المحلية، والصيغ القانونية، والترجمة الصوتية، وعلامات التشكيل، والاختصارات، وتنسيقات العناوين بعناية.
- الوصول التشغيلي: توثيق ما إذا كان سير العمل عبارة عن بحث عام، أو واجهة برمجة تطبيقات، أو ملف مجمع، أو استخراج مدفوع، أو خدمة تسجيل دخول فقط، أو ملف PDF، أو CKAN/OData/SPARQL، أو طلب يدوي.
قائمة التحقق من إعادة الاستخدام في الولايات المتحدة
| طبقة | مفيد ل | يُرجى توخي الحذر عند إعادة الاستخدام في الولايات المتحدة |
|---|---|---|
| بحث عام | مناسب للتحقق وضمان الجودة اليدوي | قد يحظر الكشط أو الاستخراج بالجملة أو إعادة الاستخدام الآلي |
| واجهة برمجة التطبيقات أو مجموعة البيانات | أفضل طريقة لتناول الطعام بشكل متكرر | لا تزال شروط نقطة النهاية والإسناد وحدود المعدل سارية |
| مستخرج أو شهادة مدفوعة | مفيد لتحقيق اليقين القانوني | عادةً ما تكون تعاقدية، وعلى مستوى المستند، وليست مجموعة بيانات مفتوحة |
| بيانات المشتريات والجهات التنظيمية | طبقة إثراء ومراقبة قوية | تغطية جزئية؛ ليس سجلاً شاملاً للشركات |
| حقول المسؤول أو المالك أو العنوان | مفيد لأغراض التحقق من هوية صاحب العمل والامتثال حيثما كان ذلك قانونيًا | موافقة تسويقية تراعي الخصوصية ولا تتم تلقائياً |
| البريد الإلكتروني والهواتف الخاصة بالعمل | طبقة التواصل التجاري | يتطلب ذلك أساسًا قانونيًا منفصلاً، ومنطقًا لحجب البيانات، وإدارة بيانات الاتصال. |
نموذج السجل الموحد في الولايات الخمسين: لماذا تختلف الولايات المتحدة؟
لا يوجد في الولايات المتحدة سجل وطني عام واحد للشركات الخاصة. تُؤسس الشركات ذات المسؤولية المحدودة والشركات المساهمة والعديد من الشراكات أو تُؤهل من خلال سلطات الولايات والأقاليم. ولذلك، فإن مجموعة بيانات الشركات الأمريكية المفيدة هي مشروع لدمج السجلات، وليست مجرد تنزيل من مصدر واحد.
- حالة التكوين: تخزين الولاية التي تم فيها تأسيس الكيان أو تنظيمه أو تسجيله.
- التأهيل الأجنبي: يمكن تأسيس شركة في ولاية واحدة وتسجيلها لممارسة الأعمال التجارية في ولايات أخرى؛ لا ينبغي إزالة التكرار من تلك السجلات بشكل أعمى.
- عنوان الوكيل المسجل وعنوان الخدمة: مفيد للخدمات القانونية والمطابقة، ولكنه ليس إشارة اتصال للمبيعات.
- الوصول إلى المستندات: بعض الولايات توفر ملفات PDF مجانية، بينما تفرض ولايات أخرى رسومًا على المستندات المعتمدة أو الطلبات بالجملة.
- الوصول إلى البيانات المجمعة/واجهة برمجة التطبيقات: تختلف التوافر والرسوم والشروط ونطاق العمل من ولاية إلى أخرى.
- وتيرة التحديث: تُعد التقارير السنوية والتعديلات وعمليات الحل وإعادة التعيين مسارات أحداث خاصة بكل ولاية.
ينبغي لنموذج بيانات الشركات العملي أن يعامل كل سجل ولاية كجزء موثوق. ولا تضيف الطبقات الفيدرالية، مثل هيئة الأوراق المالية والبورصات الأمريكية (SEC) وموقع SAM.gov وموقع USAspending ومصلحة الضرائب الأمريكية (IRS TEOS) ومكتب براءات الاختراع والعلامات التجارية الأمريكي (USPTO) ومكتب مراقبة الأصول الأجنبية (OFAC) وشبكة إنفاذ قوانين الجرائم المالية (FinCEN)، معلومات مفيدة إلا عندما يظهر الكيان في تلك القاعدة الفيدرالية.
الطبقات الفيدرالية: مفيدة وقوية، ولكنها ليست شاملة
- هيئة الأوراق المالية والبورصات الأمريكية (SEC) EDGAR: ملفات الشركات العامة والشركات المُبلِّغة، وحقائق XBRL وبيانات التعريف الخاصة بالتقديم.
- SAM.gov: الكيانات المسجلة للمشتريات الفيدرالية والاستثناءات ذات الصلة / سير عمل إدارة الكيانات.
- USAspending: بيانات المستفيدين من العقود والمنح والقروض وغيرها من المنح الفيدرالية.
- IRS TEOS: سياق البحث عن المنظمات المعفاة من الضرائب وتنزيله.
- مكتب الولايات المتحدة للبراءات والعلامات التجارية: العلامات التجارية وغيرها من إشارات ملكية/إثراء الملكية الفكرية.
- مكتب مراقبة الأصول الأجنبية: فحص الأطراف المحظورة والعقوبات، وليس البيانات الرئيسية للشركة.
- FinCEN BOI: يُعد الإبلاغ عن الملكية المستفيدة نظام امتثال مقيد، وليس مصدر بيانات مفتوحًا عامًا.
المطالبات المسموح بها والمحظورة في الولايات المتحدة
المطالبات مسموح بها
- تتمتع الولايات المتحدة بطبقات قوية مفتوحة/واجهات برمجة التطبيقات الفيدرالية لملفات الشركات العامة، والمقاولين الفيدراليين، والجوائز الفيدرالية، والمنظمات المعفاة من الضرائب، والملكية الفكرية، والعقوبات/الامتثال.
- يتم تسجيل الشركات الخاصة بشكل أساسي على مستوى الولايات؛ ولا يوجد سجل اتحادي كامل واحد للشركات يعادل سجل الشركات.
- تعتبر مواقع SEC EDGAR و SAM.gov و USAspending رسمية ومفيدة ومتوافقة مع واجهة برمجة التطبيقات، لكنها تغطي فئات محددة من الكيانات.
تم حظر المطالبات
- لا تدّعي امتلاك قاعدة بيانات رسمية كاملة ومجانية لجميع الشركات الأمريكية.
- لا تتعامل مع أمثلة سجلات هيئة الأوراق المالية والبورصات الأمريكية (SEC) أو SAM.gov أو USAspending أو سجلات الولايات على أنها سجل وطني للشركات الخاصة.
- لا تفترض أن معلومات الملكية المستفيدة لدى شبكة مكافحة الجرائم المالية (FinCEN) متاحة للعامة؛ الوصول إليها من قبل مكتب التحقيقات الفيدرالي (BOI) مقيد.
حزمة الموارد
استخدم هذه الحزمة من الموارد كخريطة عمل للتحقق، وتخطيط استيعاب البيانات، ومراجعة مخاطر المصدر. شعارات المصادر الصغيرة هي مجرد إشارات زخرفية لتعزيز المصداقية؛ أما المصداقية الحقيقية فتستمد من عنوان URL الرسمي، والمالك، ونموذج الوصول، وملاحظة إعادة الاستخدام.
السجل والهوية القانونية
البحث عن الأعمال التجارية في كاليفورنيا
الاستخدام: مثال حالة ذو حجم كبير للتحقق من الكيانات.
شاهد: خاص بولاية كاليفورنيا فقط؛ تختلف الشروط والحقول باختلاف الولاية.
واجهة برمجة التطبيقات (API)، والوصول إلى البيانات المجمعة والمفتوحة
واجهة برمجة تطبيقات إدارة الكيانات SAM.gov
الاستخدام: البحث البرمجي عن الكيانات المسجلة في SAM.gov.
شاهد: تختلف صلاحيات الوصول والحقول حسب نوع التفويض وحساسية البيانات.Data.gov
الاستخدام: طبقة اكتشاف لمجموعات البيانات الفيدرالية والولائية والمحلية والقبلية.
شاهد: الكتالوج، وليس الجهة المسؤولة عن سجلات كل ولاية.البحث عن الكيانات في ولاية ديلاوير
الاستخدام: مثال هام على حالة التأسيس.
شاهد: البحث خاص بكل ولاية وليس واجهة برمجة تطبيقات وطنية كاملة.
المشتريات والإنفاق العام
معلومات الكيانات على موقع SAM.gov
الاستخدام: سياق المتعاقدين الفيدراليين، وتسجيلات الكيانات، والاستثناءات.
شاهد: مجموعة المشتريات الفيدرالية، وليس عالم الأعمال بأكمله.واجهة برمجة تطبيقات الإنفاق الأمريكي
الاستخدام: المستفيدون من الجوائز، والعقود، والمنح، وإثراء الإنفاق الفيدرالي.
شاهد: طبقة الشركات الحائزة على الجوائز، وليس جميع الشركات الأمريكية.
الملكية الفكرية والعلامات التجارية والأصول غير الملموسة
البحث عن العلامات التجارية لدى مكتب براءات الاختراع والعلامات التجارية الأمريكي
الاستخدام: مالك العلامة التجارية وإثراء العلامة التجارية.
شاهد: طبقة بروتوكول الإنترنت، وليس البيانات الرئيسية للشركة.
الجهات التنظيمية والامتثال
واجهات برمجة تطبيقات SEC EDGAR
الاستخدام: تقديمات الجهات العامة، وحقائق الشركة، وXBRL، وإثراء بيانات الشركات المدرجة/الشركات المُبلغة.
شاهد: الشركات المُبلِّغة فقط، وليس جميع الشركات الأمريكية.data.sec.gov
الاستخدام: بيانات حقائق الشركات وبيانات التقديمات المقدمة إلى هيئة الأوراق المالية والبورصات الأمريكية (SEC) قابلة للقراءة آلياً.
شاهد: يتطلب ذلك رؤوس وصول عادلة ومعدلات طلبات معتدلة.موارد مطوري هيئة الأوراق المالية والبورصات
الاستخدام: السياق التقني والقانوني لاستخدام بيانات هيئة الأوراق المالية والبورصات.
شاهد: طبقة السياسات/التوجيهات بدلاً من سجل الشركات.واجهات برمجة تطبيقات استخراج الكيانات/الاستثناءات في نظام إدارة الأصول (SAM)
الاستخدام: استخلاصات الكيانات العامة والاستثناءات لسير عمل الامتثال.
شاهد: الحقول الحساسة والمستخلصات غير العامة مقيدة.البحث عن عقوبات مكتب مراقبة الأصول الأجنبية
الاستخدام: سياق فحص الأطراف المحظورة والامتثال.
شاهد: قائمة الامتثال، وليست سجل الشركة.FinCEN BOI
الاستخدام: تحذير بشأن الامتثال لحدود الملكية المستفيدة.
شاهد: معلومات الملكية المستفيدة ليست قاعدة بيانات عامة مفتوحة للشركات.
مصادر تحقق إضافية
البحث عن المنظمات المعفاة من الضرائب لدى مصلحة الضرائب الأمريكية
الاستخدام: سياق الكيانات غير الربحية والكيانات المعفاة من الضرائب.
شاهد: المنظمات المعفاة من الضرائب فقط.
المصادر الرسمية الرئيسية: تحليل معمق
1.
واجهات برمجة تطبيقات SEC EDGAR
مالك: الجهة التنظيمية الرسمية. وصول: https://www.sec.gov/edgar/sec-api-documentation.
- ما يوفره: تقديمات الجهات العامة، وحقائق الشركة، وXBRL، وإثراء معلومات الشركات المدرجة/الشركات المبلغة.
- قيمة إعادة الاستخدام: شروط الوصول العادل وشروط الموقع الإلكتروني لهيئة الأوراق المالية والبورصات.
- القيد الرئيسي: يقتصر الإبلاغ على الشركات فقط، وليس على جميع الشركات الأمريكية.
تُعدّ واجهات برمجة تطبيقات SEC EDGAR مصدرًا رسميًا للهيئة التنظيمية في الولايات المتحدة. وتتمثل قيمتها العملية الرئيسية في بيانات الشركات المُدرجة في البورصة، ومعلومات الشركات، وبيانات XBRL، وإثراء بيانات الشركات المُدرجة/المُبلِّغة. يُمكن الوصول إليها عبر الرابط https://www.sec.gov/edgar/sec-api-documentation، لذا ينبغي التعامل مع هذا المصدر وفقًا لنموذج الوصول المُحدد، بدلًا من اعتباره مصدرًا مفتوحًا غير مقيد.
لإعادة الاستخدام، تنص القاعدة العملية على: شروط الوصول العادل وشروط الموقع الإلكتروني لهيئة الأوراق المالية والبورصات الأمريكية. ويقتصر القيد الرئيسي على الشركات المُبلِّغة فقط، وليس جميع الشركات الأمريكية. في سير عمل بيانات الشركات الموحد، ينبغي توثيق هذا المصدر مع ذكر المصدر وتاريخ الاسترجاع والتحذيرات على مستوى الحقول، مع التمييز بوضوح بين بيانات الكيان القانوني، وإشارات الامتثال، وأي بيانات تسويقية/معلومات اتصال لاحقة.
2.
data.sec.gov
مالك: الجهة التنظيمية الرسمية. وصول: https://data.sec.gov/.
- ما يوفره: بيانات حقائق الشركات وبيانات التقديمات المقدمة إلى هيئة الأوراق المالية والبورصات الأمريكية (SEC) قابلة للقراءة آلياً.
- قيمة إعادة الاستخدام: إرشادات هيئة الأوراق المالية والبورصات بشأن الوصول العادل وسعر الطلب
- القيد الرئيسي: يتطلب رؤوس وصول عادلة ومعدلات طلب معتدلة.
يُعدّ موقع data.sec.gov مصدرًا رسميًا لهيئة الأوراق المالية والبورصات الأمريكية. وتتمثل قيمته العملية الرئيسية في بيانات حقائق الشركات وتقاريرها المُقدّمة إلى الهيئة، والتي يُمكن قراءتها آليًا. ويتم الوصول إليه عبر الرابط https://data.sec.gov/، لذا ينبغي التعامل مع هذا المصدر وفقًا لنموذج الوصول المُعتمد، بدلًا من اعتباره مصدرًا مفتوحًا غير مقيد.
لإعادة الاستخدام، تنص القاعدة العملية على: إرشادات هيئة الأوراق المالية والبورصات بشأن الوصول العادل ومعدل الطلبات. ويتمثل القيد الرئيسي في اشتراط تضمين رؤوس الوصول العادل ومعدلات طلبات معتدلة. في سير عمل بيانات الشركة الموحد، ينبغي توثيق هذا المصدر مع ذكر المصدر وتاريخ الاسترجاع وملاحظات على مستوى الحقول، بالإضافة إلى تمييز واضح بين بيانات الكيان القانوني وإشارات الامتثال وأي بيانات تسويقية/معلومات اتصال لاحقة.
3.
موارد مطوري هيئة الأوراق المالية والبورصات
مالك: الجهة التنظيمية الرسمية. وصول: https://www.sec.gov/about/developer-resources.
- ما يوفره: سياق تقني وقانوني لاستخدام بيانات هيئة الأوراق المالية والبورصات.
- قيمة إعادة الاستخدام: شروط هيئة الأوراق المالية والبورصات وسياسة الوصول العادل
- القيد الرئيسي: طبقة السياسات/التوجيهات بدلاً من سجل الشركات.
تُعدّ موارد مطوّري هيئة الأوراق المالية والبورصات الأمريكية مصدرًا رسميًا للهيئة في الولايات المتحدة. وتكمن قيمتها العملية الرئيسية في توفير سياق تقني وقانوني لاستخدام بيانات الهيئة. ويمكن الوصول إليها عبر الرابط https://www.sec.gov/about/developer-resources، لذا ينبغي التعامل مع هذا المصدر وفقًا لنموذج الوصول المذكور، بدلًا من اعتباره مصدرًا مفتوحًا غير مقيد.
لإعادة الاستخدام، تنص القاعدة العملية على: شروط هيئة الأوراق المالية والبورصات وسياسة الوصول العادل. يتمثل القيد الرئيسي في وجود طبقة السياسات/التوجيهات بدلاً من سجل الشركة. في سير عمل بيانات الشركة الموحد، ينبغي توثيق هذا المصدر مع ذكر المصدر وتاريخ الاسترجاع والتحذيرات على مستوى الحقول، مع تمييز واضح بين بيانات الكيان القانوني وإشارات الامتثال وأي إثراء لاحق لبيانات التسويق/التواصل.
4.
معلومات الكيانات على موقع SAM.gov
مالك: مصدر رسمي للمشتريات/الكيانات الفيدرالية. وصول: https://sam.gov/content/entity-information.
- ما يوفره: سياق المتعاقدين الفيدراليين، وتسجيلات الكيانات، والاستثناءات.
- قيمة إعادة الاستخدام: مصطلحات SAM.gov وحدود FOIA/CUI
- القيد الرئيسي: يقتصر على مجموعة المشتريات الفيدرالية، وليس على عالم الأعمال الكامل.
يُعدّ موقع SAM.gov Entity Information مصدرًا رسميًا لمعلومات المشتريات الفيدرالية والكيانات في الولايات المتحدة. وتكمن قيمته العملية الرئيسية في توفير معلومات عن المقاولين الفيدراليين، وتسجيلات الكيانات، والاستثناءات. ويمكن الوصول إليه عبر الرابط https://sam.gov/content/entity-information، لذا ينبغي التعامل مع هذا المصدر وفقًا لنموذج الوصول المذكور، بدلًا من اعتباره مصدرًا مفتوحًا غير مقيد.
لإعادة الاستخدام، القاعدة العملية هي: استخدام مصطلحات SAM.gov وحدود قانون حرية المعلومات/المعلومات غير المصنفة. يتمثل القيد الرئيسي في بيانات المشتريات الفيدرالية، وليس في جميع قطاعات الأعمال. في سير عمل بيانات الشركة الموحد، يجب توثيق هذا المصدر مع ذكر المصدر وتاريخ الاسترجاع والتحذيرات على مستوى الحقول، مع تمييز واضح بين بيانات الكيان القانوني، وإشارات الامتثال، وأي بيانات تسويقية/معلومات اتصال لاحقة.
5.
واجهة برمجة تطبيقات إدارة الكيانات SAM.gov
مالك: واجهة برمجة التطبيقات الرسمية لهيئة الخدمات العامة الأمريكية (GSA). وصول: https://open.gsa.gov/api/entity-api/.
- ما يوفره: البحث البرمجي عن الكيانات المسجلة في SAM.gov.
- قيمة إعادة الاستخدام: شروط واجهة برمجة تطبيقات GSA/SAM وقيود CUI
- القيد الرئيسي: تختلف إمكانية الوصول والحقول حسب نوع التفويض وحساسية البيانات.
واجهة برمجة تطبيقات إدارة الكيانات SAM.gov هي مصدر رسمي لواجهات برمجة تطبيقات إدارة الخدمات العامة (GSA) في الولايات المتحدة. وتتمثل قيمتها العملية الرئيسية في البحث البرمجي عن الكيانات المسجلة في SAM.gov. يتم الوصول إليها عبر الرابط https://open.gsa.gov/api/entity-api/، لذا ينبغي التعامل مع المصدر وفقًا لنموذج الوصول هذا، وليس اعتباره مصدرًا مفتوحًا للبيانات.
لإعادة الاستخدام، تنص القاعدة العملية على: شروط واجهة برمجة تطبيقات GSA/SAM وقيود CUI. يتمثل القيد الرئيسي في الوصول، وتختلف الحقول حسب مستوى الصلاحية وحساسية البيانات. في سير عمل بيانات الشركة الموحد، يجب توثيق هذا المصدر مع ذكر المصدر وتاريخ الاسترجاع وملاحظات مستوى الحقل، مع تمييز واضح بين بيانات الكيان القانوني وإشارات الامتثال وأي إثراء لاحق لبيانات التسويق/جهات الاتصال.
6.
واجهات برمجة تطبيقات استخراج الكيانات/الاستثناءات في نظام إدارة الأصول (SAM)
مالك: واجهة برمجة التطبيقات الرسمية لهيئة الخدمات العامة الأمريكية (GSA). وصول: https://open.gsa.gov/api/sam-entity-extracts-api/.
- ما يوفره: مستخلصات الكيانات العامة والاستثناءات لسير عمل الامتثال.
- قيمة إعادة الاستخدام: حدود قانون حرية المعلومات/الاستخراج العام وحدود المعلومات غير المصنفة الخاضعة للرقابة
- القيد الرئيسي: الحقول الحساسة والمستخلصات غير العامة مقيدة.
تُعدّ واجهات برمجة تطبيقات استخراج الكيانات/الاستثناءات من نظام إدارة الأصول (SAM) مصدرًا رسميًا لواجهات برمجة التطبيقات التابعة لإدارة الخدمات العامة الأمريكية (GSA). وتتمثل قيمتها العملية الرئيسية في استخراج الكيانات والاستثناءات العامة لدعم عمليات الامتثال. يتم الوصول إليها عبر الرابط https://open.gsa.gov/api/sam-entity-extracts-api/، لذا ينبغي التعامل مع هذا المصدر وفقًا لنموذج الوصول المذكور، وليس باعتباره مصدرًا مفتوحًا غير مقيد.
لإعادة الاستخدام، تنص القاعدة العملية على: حدود المعلومات الخاضعة لقانون حرية المعلومات/المعلومات العامة وحدود المعلومات غير المصنفة الخاضعة للرقابة. يتمثل القيد الرئيسي في تقييد الحقول الحساسة والمعلومات غير العامة. في سير عمل بيانات الشركة الموحد، يجب توثيق هذا المصدر مع ذكر المصدر وتاريخ الاسترجاع وملاحظات على مستوى الحقل، مع تمييز واضح بين بيانات الكيان القانوني وإشارات الامتثال وأي بيانات تسويقية/معلومات اتصال لاحقة.
7.
واجهة برمجة تطبيقات الإنفاق الأمريكي
مالك: البيانات الفيدرالية الرسمية المفتوحة. وصول: https://api.usaspending.gov/docs/.
- ما يقدمه: متلقو الجوائز، والعقود، والمنح، وإثراء الإنفاق الفيدرالي.
- قيمة إعادة الاستخدام: شروط بيانات الإنفاق الأمريكي/البيانات الفيدرالية العامة
- القيد الرئيسي: طبقة متلقي الجوائز، وليس جميع الشركات الأمريكية.
واجهة برمجة تطبيقات USAspending هي مصدر بيانات فيدرالي مفتوح رسمي للولايات المتحدة. وتتمثل قيمتها العملية الرئيسية في معلومات متلقي الجوائز والعقود والمنح وإثراء بيانات الإنفاق الفيدرالي. ويمكن الوصول إليها عبر الرابط https://api.usaspending.gov/docs/، لذا ينبغي التعامل مع المصدر وفقًا لنموذج الوصول هذا، وليس اعتباره مصدرًا مفتوحًا غير مقيد.
لإعادة الاستخدام، القاعدة العملية هي: شروط بيانات الإنفاق الحكومي الأمريكي/البيانات الفيدرالية العامة. يتمثل القيد الرئيسي في طبقة متلقي الجوائز، وليس جميع الشركات الأمريكية. في سير عمل بيانات الشركات الموحد، يجب توثيق هذا المصدر مع ذكر المصدر، وتاريخ الاسترجاع، والتحذيرات على مستوى الحقول، والتمييز الواضح بين حقائق الكيان القانوني، وإشارات الامتثال، وأي إثراء لاحق لبيانات التسويق/التواصل.
8.
Data.gov
مالك: البيانات الرسمية المفتوحة. وصول: https://catalog.data.gov/.
- ما يوفره: طبقة اكتشاف لمجموعات البيانات الفيدرالية والولائية والمحلية والقبلية.
- قيمة إعادة الاستخدام: مصطلحات خاصة بمجموعة البيانات الحكومية الأمريكية
- القيد الرئيسي: الفهرس، وليس السلطة المختصة بسجل كل ولاية.
يُعدّ موقع Data.gov مصدرًا رسميًا للبيانات المفتوحة في الولايات المتحدة. وتكمن قيمته العملية الرئيسية في توفير طبقة بيانات شاملة للبيانات الفيدرالية والولائية والمحلية والقبلية. يتم الوصول إليه عبر الرابط https://catalog.data.gov/، لذا ينبغي التعامل مع هذا المصدر وفقًا لنموذج الوصول هذا، بدلًا من اعتباره مصدرًا مفتوحًا للبيانات.
لإعادة الاستخدام، تنص القاعدة العملية على استخدام مصطلحات حكومية أمريكية خاصة بمجموعة البيانات. ويكمن القيد الرئيسي في الفهرس، وليس في الجهة المسؤولة عن سجلات كل ولاية. في سير عمل بيانات الشركة الموحد، ينبغي توثيق هذا المصدر مع ذكر المصدر، وتاريخ الاسترجاع، والملاحظات على مستوى الحقول، والتمييز الواضح بين بيانات الكيان القانوني، وإشارات الامتثال، وأي بيانات تسويقية/معلومات اتصال لاحقة.
9.
البحث عن الأعمال التجارية في كاليفورنيا
مالك: السجل الرسمي للولاية. وصول: https://bizfileonline.sos.ca.gov/search/business.
- ما يقدمه: مثال حالة ذو حجم كبير للتحقق من الكيانات.
- قيمة إعادة الاستخدام: مصطلحات وزير خارجية ولاية كاليفورنيا
- القيد الرئيسي: يقتصر على ولاية كاليفورنيا فقط؛ تختلف الشروط والحقول باختلاف الولاية.
يُعدّ موقع California Business Search مصدرًا رسميًا لسجلات الشركات في الولايات المتحدة. وتكمن أهميته العملية في كونه مثالًا نموذجيًا واسع النطاق للتحقق من الكيانات. ويمكن الوصول إليه عبر الرابط https://bizfileonline.sos.ca.gov/search/business، لذا ينبغي التعامل مع هذا المصدر وفقًا لنموذج الوصول هذا، بدلًا من اعتباره مصدرًا مفتوحًا للبيانات.
لإعادة الاستخدام، القاعدة العملية هي: مصطلحات وزارة الخارجية في كاليفورنيا. القيد الرئيسي هو أن هذه المصطلحات خاصة بكاليفورنيا فقط؛ إذ تختلف المصطلحات والحقول من ولاية إلى أخرى. في سير عمل بيانات الشركة الموحد، يجب توثيق هذا المصدر مع ذكر المصدر وتاريخ الاسترجاع وملاحظات على مستوى الحقول، مع تمييز واضح بين بيانات الكيان القانوني وإشارات الامتثال وأي بيانات تسويقية/معلومات اتصال لاحقة.
10.
البحث عن الكيانات في ولاية ديلاوير
مالك: السجل الرسمي للولاية. وصول: https://icis.corp.delaware.gov/Ecorp/EntitySearch/NameSearch.aspx.
- ما يقدمه: مثال هام على حالة الإدماج.
- قيمة إعادة الاستخدام: شروط قسم الشركات في ولاية ديلاوير
- القيد الرئيسي: البحث خاص بكل ولاية وليس واجهة برمجة تطبيقات وطنية كاملة.
يُعدّ البحث عن الكيانات في ولاية ديلاوير مصدرًا رسميًا لسجلات الولايات المتحدة. وتكمن أهميته العملية في كونه مثالًا هامًا لتأسيس الشركات في الولاية. يُمكن الوصول إليه عبر الرابط https://icis.corp.delaware.gov/Ecorp/EntitySearch/NameSearch.aspx، لذا يجب التعامل مع هذا المصدر وفقًا لنموذج الوصول هذا، بدلًا من اعتباره مصدرًا مفتوحًا للبيانات.
لإعادة الاستخدام، القاعدة العملية هي: مصطلحات قسم الشركات في ولاية ديلاوير. يتمثل القيد الرئيسي في أن البحث خاص بالولاية وليس واجهة برمجة تطبيقات وطنية شاملة. في سير عمل بيانات الشركة الموحد، يجب توثيق هذا المصدر مع ذكر المصدر، وتاريخ الاسترجاع، والتحذيرات على مستوى الحقول، والتمييز الواضح بين بيانات الكيان القانوني، وإشارات الامتثال، وأي إثراء لاحق لبيانات التسويق/التواصل.
خيارات عملية
المسار الرسمي للبيانات المفتوحة أو واجهة برمجة التطبيقات
ابدأ باختصاص التأسيس أو التأهيل للشركات الخاصة، ثم أضف الطبقات الفيدرالية فقط عندما ينتمي الكيان إلى تلك الفئة: SEC EDGAR للشركات المبلغة، وSAM.gov لتسجيل المشتريات الفيدرالية، وUSAspending للجوائز، وIRS TEOS للمنظمات المعفاة، وUSPTO للعلامات التجارية، وOFAC لفحص الأطراف المقيدة.
للاستخدام الإنتاجي، تعامل مع هذا المسار كخطة استيعاب بيانات بدلاً من تنزيل واحد. ابدأ بالسجل الرسمي أو فهرس البيانات، واحتفظ بنسخ احتياطية من المصدر الخام، وسجل شروط الوصول، ثم أضف مصادر الإثراء واحداً تلو الآخر مع تحديد مصدر البيانات على مستوى الحقل.
التحقق اليدوي ومسار المستندات
تكشف بعض الدول عن معلومات هامة تخص الشركات من خلال الشهادات، وملفات PDF، وإشعارات الجريدة الرسمية، والمقتطفات المدفوعة، أو الخدمات التي تتطلب تسجيل الدخول. قد تكون هذه المصادر قيّمة، ولكن ينبغي توثيقها ضمن إجراءات عمل مُحكمة. لا تصفها بأنها واجهات برمجة تطبيقات مفتوحة أو مجموعات بيانات ضخمة إلا إذا نشرت الجهة المختصة نموذج الوصول هذا بوضوح.
مسار بيانات الاتصال وقائمة التسويق
في مجال التسويق، تُعدّ بيانات هوية الشركة مجرد الطبقة الأولى. أما عناوين البريد الإلكتروني الخاصة بالعمل، وأرقام الهواتف، وأدوار جهات الاتصال، ومنطق الحجب، والتجزئة، فتتطلب عملية بيانات اتصال منفصلة ومتوافقة مع المعايير. وينبغي توثيق هذه الطبقة بشكل منفصل عن إعادة استخدام السجل الرسمي.
التقارير الخاصة ومنتجات إدارة المخاطر
قد تكون شركات إعداد التقارير الخاصة بالشركات مفيدة لإجراء الفحص النافي للجهالة اليدوي في الولايات المتحدة، لكن التركيز التحريري هنا ليس على دليل للمنافسين. تكمن القيمة الاستراتيجية في فهم المصادر الرسمية المتاحة وتحديد المجالات التي تتطلب توحيد المعايير.
إذا احتاج المستخدم إلى سجلات شركة جاهزة لنظام إدارة علاقات العملاء (CRM)، فإنّ الحل الأمثل هو الجمع بين توثيق المصدر الرسمي وإثراء البيانات، وإزالة البيانات المكررة، وفحوصات الجودة، وضوابط التسليم القانونية. وهذا يختلف عن شراء قائمة عملاء محتملين عامة: إذ يوضح مستوى المصدر الرسمي ما يمكن التحقق منه، بينما يوضح مستوى مجموعة البيانات التجارية كيفية استخدام السجلات عمليًا.
ما الذي ينقص البيانات المفتوحة الرسمية؟
- لا تدّعي امتلاك قاعدة بيانات كاملة ومجانية ورسمية لشركات الولايات المتحدة.
- تُعد سجلات الدولة سلطات مستقلة ذات مجالات ورسوم وواجهات برمجة تطبيقات مختلفة، بالإضافة إلى إمكانية الوصول إلى المستندات ودورات التحديث وشروط إعادة الاستخدام.
- يغطي نظام SEC EDGAR الشركات والملفات التي تقدم التقارير، وليس كل شركة ذات مسؤولية محدودة خاصة، أو شركة مساهمة، أو شراكة، أو ملكية فردية.
- يغطي موقعا SAM.gov و USAspending عمليات الشراء/الكيانات الفيدرالية ومجموعات الجوائز، وليس عالم الأعمال بأكمله.
- تُعد معلومات الملكية المستفيدة الخاصة بشبكة مكافحة الجرائم المالية (FinCEN) بيانات امتثال مقيدة، وليست مجموعة بيانات عامة مفتوحة للشركة.
- لا تُعد سجلات وزير الخارجية وعناوين الوكلاء المسجلين وجهات اتصال المشتريات وحقول المسؤولين والبيانات المعفاة من الضرائب بمثابة موافقة على الاتصال التسويقي.
- يجب أن تحافظ عملية تسليم بيانات الشركات التجارية على فصل هوية الشركة، ومصدرها الرسمي، وبيانات الإثراء، وحقول بيانات الاتصال.
ولهذا السبب غالباً ما تضيف منتجات بيانات الشركات قيمة حتى عندما تكون المصادر العامة الأساسية قوية: فالبيانات الرسمية غالباً ما تكون مقسمة عبر السلطات والتنسيقات واللغات والمعرفات ونماذج الوصول.
ينبغي معالجة البيانات المفقودة بشكل صريح في تصميم مجموعة البيانات. إذا كان المصدر الرسمي يفتقر إلى إمكانية التنزيل المجمع، فلا ينبغي لـ CompaniesData التظاهر بوجود الملف المجمع؛ بل يجب عليها تسجيل قيود المصدر، وإضافة مصادر إثراء رسمية بديلة حيثما يسمح القانون بذلك، وعرض حقول الثقة لكي يعرف المستخدمون أي السمات أتت من أي طبقة.
نموذج البيانات الموصى به
ينبغي لنموذج عملي على غرار نموذج CompaniesData للولايات المتحدة أن يفصل بين بيانات المصدر وحقول الاستخدام التجاري. يجب أن يحتوي الجدول الأساسي على هوية الكيان القانوني، وحالته، ومعرفات التسجيل، والشكل القانوني، والاختصاص القضائي، والعنوان المسجل، وتواريخ المصدر. ويمكن لجداول الإثراء المنفصلة تخزين بيانات عقود التوريد، وأصول الملكية الفكرية، وحالة الجهات التنظيمية، وإشارات الشركات المدرجة، ومطابقات معرفات الكيانات القانونية، ونتائج العقوبات/الامتثال، وإحصاءات القطاع.
- هوية الكيان: الاسم القانوني، الاسم الموحد، رقم التسجيل، الاختصاص القضائي، الشكل القانوني، وحالة دورة الحياة.
- مصدر المعلومات: عنوان URL للمصدر، والجهة المرجعية، وتاريخ الاسترجاع، وطريقة الوصول، وملاحظة الترخيص/إعادة الاستخدام، وعلامة الثقة.
- تاريخ الأحداث: التأسيس، والتعديلات، والإيداعات، والإشعارات المنشورة في الجريدة الرسمية، والإعسار أو الحل حيثما يكون ذلك قانونيًا عامًا.
- الإثراء: طبقات المشتريات، والملكية الفكرية، والجهات التنظيمية، والبورصة، ومعرف الكيان القانوني، والإحصاءات الرسمية مع تواريخ مصادرها الخاصة.
- التسليم التجاري: عمليات التصدير الجاهزة لنظام إدارة علاقات العملاء، والتجزئة، وحقول بيانات الاتصال فقط عند وجود أساس قانوني منفصل وسير عمل للحجب.
كيف تضيف بيانات الشركات قيمة
بالنسبة للولايات المتحدة، يتمثل دور CompaniesData في تحويل المواد المصدرية المجزأة إلى مجموعة بيانات أعمال قابلة للاستخدام: أسماء شركات موحدة، وكيانات غير مكررة، وحقول بلد ونشاط متسقة، ومصدر البيانات، وتتبع التحديثات، وخطافات الإثراء.
- توحيد معرّفات السجلات والأسماء القانونية.
- قم بمطابقة سجلات الشركة الرسمية مع إشارات المشتريات، والملكية الفكرية، ومعرف الكيان القانوني، والجهات التنظيمية.
- قم بتحديد مصدر البيانات بحيث يمكن تدقيق كل ملف تعريف مشتق.
- افصل هوية الشركة عن طبقات بيانات الاتصال وأذونات التسويق.
- تجميع البيانات لأغراض التحليل، وإثراء إدارة علاقات العملاء، وأبحاث السوق بدلاً من إجبار المستخدمين على تحليل البوابات يدويًا.
بالنسبة للولايات المتحدة، لا تكمن القيمة التحريرية لـ CompaniesData في الادعاء بأن كل سجل مفتوح أو أنه يمكن إعادة استخدام كل حقل دون شروط. بل تكمن القيمة في عكس ذلك تمامًا: إظهار حدود المصادر، وتوحيد السجلات غير المنظمة، وإضافة معلومات قابلة للتفسير، وتقديم مجموعة بيانات يمكن للمستخدمين مراجعتها بدلًا من مجرد استخراج بيانات مبهمة.
اطلب عينة من بيانات الشركات للولايات المتحدة إذا كنت بحاجة إلى مجموعة بيانات عملية بدلاً من قائمة ببوابات المصادر.
مجموعة البيانات التجارية وحدود بيانات الاتصال
يدعم قانون البيانات المفتوحة للشركات في الولايات المتحدة حركة بيع قواعد بيانات الشركات، ولكن يجب ألا يخلط بين السجلات الرسمية وقوائم التسويق. يمكن أن تساعد سجلات وزارة الخارجية، أو ملفات هيئة الأوراق المالية والبورصات، أو تسجيل نظام إدارة العقود الآلية (SAM)، أو سجلات متلقي الجوائز، أو سجلات مالكي العلامات التجارية، أو قوائم العقوبات، في التحقق من هوية الشركة. ولا يمنح ذلك الإذن بالتواصل مع تلك الشركة عبر البريد الإلكتروني أو الهاتف.
- طبقة هوية الشركة: الأسماء القانونية، وأرقام تعريف الدولة، والاختصاص القضائي، والحالة، وحقول الوكيل المسجل، وتواريخ المصدر.
- طبقة الإثراء: SEC CIKs، SAM UEIs، معرفات المستلمين في USAspending، مالكي USPTO، نتائج OFAC ومطابقات LEI حيثما كان ذلك قانونيًا.
- طبقة بيانات الاتصال: تتطلب رسائل البريد الإلكتروني التجارية والهواتف والأدوار وحجب البيانات وتقسيم التواصل سير عمل منفصل قائم على أساس قانوني من خلال CompaniesData.cloud.
- المشترون الناطقون بالإسبانية: يمكن توجيه طلبات بيانات الاتصال إلى CentraldeCommunicacion.es بدلاً من التوصية بمنافسين من جهات خارجية في مجال بيانات الاتصال.
مصفوفة المصدر
| مصدر | مالك | ما يمنحه | قيمة إعادة الاستخدام | القيود |
|---|---|---|---|---|
| الجهة التنظيمية الرسمية | تقديمات الجهات العامة، وحقائق الشركة، وXBRL، وإثراء بيانات الشركات المدرجة/الشركات المُبلغة. | شروط الوصول العادل وشروط موقع الويب الخاصة بهيئة الأوراق المالية والبورصات. | الشركات المُبلِّغة فقط، وليس جميع الشركات الأمريكية. | |
| الجهة التنظيمية الرسمية | بيانات حقائق الشركات وبيانات التقديمات المقدمة إلى هيئة الأوراق المالية والبورصات الأمريكية (SEC) قابلة للقراءة آلياً. | إرشادات هيئة الأوراق المالية والبورصات بشأن الوصول العادل وسعر الطلب | يتطلب ذلك رؤوس وصول عادلة ومعدلات طلبات معتدلة. | |
| الجهة التنظيمية الرسمية | السياق التقني والقانوني لاستخدام بيانات هيئة الأوراق المالية والبورصات. | شروط هيئة الأوراق المالية والبورصات وسياسة الوصول العادل | طبقة السياسات/التوجيهات بدلاً من سجل الشركات. | |
| جهة مشتريات اتحادية رسمية / مصدر الكيان | سياق المتعاقدين الفيدراليين، وتسجيلات الكيانات، والاستثناءات. | مصطلحات SAM.gov وحدود قانون حرية المعلومات/المعلومات غير المصنفة | مجموعة المشتريات الفيدرالية، وليس عالم الأعمال بأكمله. | |
| واجهة برمجة التطبيقات الرسمية لهيئة الخدمات العامة | البحث البرمجي عن الكيانات المسجلة في SAM.gov. | شروط واجهة برمجة التطبيقات GSA/SAM وقيود CUI | تختلف صلاحيات الوصول والحقول حسب نوع التفويض وحساسية البيانات. | |
| واجهة برمجة التطبيقات الرسمية لهيئة الخدمات العامة | استخلاصات الكيانات العامة والاستثناءات لسير عمل الامتثال. | حدود قانون حرية المعلومات/المستخرجات العامة وحدود المعلومات غير المصنفة الخاضعة للرقابة | الحقول الحساسة والمستخلصات غير العامة مقيدة. | |
| البيانات الفيدرالية الرسمية المفتوحة | المستفيدون من الجوائز، والعقود، والمنح، وإثراء الإنفاق الفيدرالي. | شروط الإنفاق الأمريكي/البيانات الفيدرالية العامة | طبقة الشركات الحائزة على الجوائز، وليس جميع الشركات الأمريكية. | |
| البيانات المفتوحة الرسمية | طبقة اكتشاف لمجموعات البيانات الفيدرالية والولائية والمحلية والقبلية. | مصطلحات خاصة بمجموعة البيانات الحكومية الأمريكية | الكتالوج، وليس الجهة المسؤولة عن سجلات كل ولاية. | |
| السجل الحكومي الرسمي | مثال حالة ذو حجم كبير للتحقق من الكيانات. | فترات ولاية وزير خارجية ولاية كاليفورنيا | خاص بولاية كاليفورنيا فقط؛ تختلف الشروط والحقول باختلاف الولاية. | |
| السجل الحكومي الرسمي | مثال هام على حالة التأسيس. | شروط قسم الشركات في ولاية ديلاوير | البحث خاص بكل ولاية وليس واجهة برمجة تطبيقات وطنية كاملة. | |
| هيئة الضرائب الرسمية | سياق الكيانات غير الربحية والكيانات المعفاة من الضرائب. | شروط المعلومات العامة لمصلحة الضرائب الأمريكية | المنظمات المعفاة من الضرائب فقط. | |
| هيئة الملكية الفكرية الرسمية | مالك العلامة التجارية وإثراء العلامة التجارية. | شروط مكتب براءات الاختراع والعلامات التجارية الأمريكي وإشعارات خاصة بمجموعة البيانات | طبقة بروتوكول الإنترنت، وليس البيانات الرئيسية للشركة. | |
| سلطة العقوبات الرسمية | سياق فحص الأطراف المحظورة والامتثال. | شروط وزارة الخزانة الأمريكية | قائمة الامتثال، وليست سجل الشركة. | |
| الهيئة الرسمية لمكافحة الجرائم المالية | تحذير بشأن الامتثال لحدود الملكية المستفيدة. | بيانات مقيدة؛ ليست بيانات مفتوحة عامة | معلومات الملكية المستفيدة ليست قاعدة بيانات عامة مفتوحة للشركات. |
تُعدّ الولايات المتحدة ذات أهمية تجارية بالغة، إلا أنها لا مركزية هيكليًا. وتتوفر فيها واجهات برمجة تطبيقات رسمية قوية، بالإضافة إلى طبقات معالجة جماعية، لجهات تقديم التقارير إلى هيئة الأوراق المالية والبورصات، والمتعاقدين الفيدراليين، والجهات المستفيدة من المنح الفيدرالية، والمنظمات المعفاة من الضرائب، والعلامات التجارية، والعقوبات/الامتثال. يتم تأسيس الشركات الخاصة على مستوى الولايات، لذا يجب أن تبدأ أي مقالة بالإشارة إلى عدم وجود سجل وطني موحد للشركات الخاصة، وشرح آلية الربط بين كل ولاية وأخرى.
الأسئلة الشائعة
هل توجد قاعدة بيانات رسمية واحدة مجانية لشركات الشحن بالجملة في الولايات المتحدة؟
ليس دائمًا. تمتلك الولايات المتحدة مصادر بيانات رسمية للشركات، لكن الوصول إلى البيانات المجمعة، والوصول إلى واجهة برمجة التطبيقات (API)، والبيانات المدفوعة، والبحث عبر الإنترنت قد تكون منتجات منفصلة. لا تفترض وجود ملف بيانات مجمعة مجاني كامل إلا إذا أثبت المصدر ذلك.
ما هو أفضل مصدر أولي لبيانات الشركات الأمريكية؟
أفضل المصادر الأولية هي سجلات الشركات الحكومية للتحقق من الوجود القانوني للشركات الخاصة، ونظام EDGAR التابع لهيئة الأوراق المالية والبورصات الأمريكية للشركات المُبلِّغة، وموقع SAM.gov وموقع USAspending للمقاولين الفيدراليين والمتلقين للجوائز، وبيانات المنظمات المعفاة من الضرائب الصادرة عن مصلحة الضرائب الأمريكية، وبيانات العلامات التجارية الصادرة عن مكتب براءات الاختراع والعلامات التجارية الأمريكي، وفحص عقوبات مكتب مراقبة الأصول الأجنبية، وشبكة مكافحة الجرائم المالية (FinCEN) كحدود امتثال غير عامة ومقيدة. ينبغي بعد ذلك دمج هذه المصادر مع مصادر الإحصاءات والمشتريات والملكية الفكرية والجهات التنظيمية.
هل يمكن إعادة استخدام بيانات الشركات المساهمة العامة تجارياً؟
نعم في كثير من الأحيان، ولكن فقط وفقًا لشروط المصدر المحدد. قد تُطبق ضوابط الإسناد، وحفظ تاريخ التحديث، وعدم التأييد، وضوابط اللائحة العامة لحماية البيانات (GDPR).
هل يمكنني استخدام بيانات التسجيل في التسويق عبر البريد الإلكتروني غير المرغوب فيه؟
لا يُستنتج أي استنتاج تلقائي من الوصول إلى السجل العام. يتطلب التسويق أساسًا قانونيًا منفصلاً، وإجراءات لحجب البيانات، ومراجعة امتثال بيانات الاتصال.
لماذا نستخدم بيانات الشركات بدلاً من جمع المصادر الأمريكية يدوياً؟
تُعدّ عملية جمع البيانات يدويًا بطيئة نظرًا لاختلاف المعرّفات والتنسيقات واللغات والتغطية باختلاف المصدر. يُضيف برنامج CompaniesData ميزات التوحيد والمطابقة وإزالة البيانات المكررة وتحديد المصدر وتنسيقات التسليم العملية.
كم مرة يجب تحديث بيانات الشركات في الولايات المتحدة؟
تعتمد وتيرة التحديث على المصدر. تدعم عمليات البحث في السجلات وواجهات برمجة التطبيقات عمليات التحقق المتكررة، بينما قد يتم تحديث الجرائد الرسمية وبوابات المشتريات والإصدارات الإحصائية والمستخلصات المدفوعة وفق جداول زمنية مختلفة. ينبغي أن تحتوي مجموعة البيانات الموثوقة على تواريخ الاسترجاع وملاحظات التحديث الخاصة بكل مصدر.
ما الذي يجب تدقيقه قبل نشر أو بيع مجموعة بيانات مُحسّنة؟
تدقيق سلطة المصدر، وشروط الترخيص، والتعرض للبيانات الشخصية، والأساس القانوني لبيانات الاتصال، ومصدر البيانات الميدانية، وقواعد الحجب، وتواريخ التحديث، وما إذا كان أي مصدر رسمي يحظر إعادة الاستخدام أو إعادة البيع الآلي.
مصادر
واجهات برمجة تطبيقات SEC EDGAR – الجهة التنظيمية الرسمية
data.sec.gov – الجهة التنظيمية الرسمية
موارد مطوري هيئة الأوراق المالية والبورصات – الجهة التنظيمية الرسمية
معلومات الكيانات على موقع SAM.gov – مصدر رسمي للمشتريات/الكيانات الفيدرالية
واجهة برمجة تطبيقات إدارة الكيانات SAM.gov واجهة برمجة التطبيقات الرسمية لهيئة الخدمات العامة الأمريكية
واجهات برمجة تطبيقات استخراج الكيانات/الاستثناءات في نظام إدارة الأصول (SAM) واجهة برمجة التطبيقات الرسمية لهيئة الخدمات العامة الأمريكية
واجهة برمجة تطبيقات الإنفاق الأمريكي – البيانات الفيدرالية الرسمية المفتوحة
Data.gov – البيانات المفتوحة الرسمية
البحث عن الأعمال التجارية في كاليفورنيا – السجل الرسمي للدولة
البحث عن الكيانات في ولاية ديلاوير – السجل الرسمي للدولة
البحث عن المنظمات المعفاة من الضرائب لدى مصلحة الضرائب الأمريكية – السلطة الضريبية الرسمية
البحث عن العلامات التجارية لدى مكتب براءات الاختراع والعلامات التجارية الأمريكي – هيئة الملكية الفكرية الرسمية
البحث عن عقوبات مكتب مراقبة الأصول الأجنبية – سلطة العقوبات الرسمية
FinCEN BOI – الهيئة الرسمية لمكافحة الجرائم المالية
اترك تعليق
تريد الانضمام إلى مناقشة؟لا تتردد في المساهمة!