Допомога у програмуванні, відповіді на питання / Ibm Watson / Використання інформації про рядки та колонки таблиці в службі IBM Watson Discovery - ibm-watson, watson-discovery

Використання таблиці стовпців та заголовків стовпчиків в службі IBM Watson Discovery - ibm-watson, watson-discovery

Моя команда хоче застосувати пізнавальний пошук довеликий масив неструктурованих документів "Поліс" (наприклад, документи полісу автомобільного страхування). Частина інформації в цих документах організована у форматованих таблицях. Людський читач використовує заголовки рядків і стовпців для інтерпретації документів.

Наприклад, покриття моєї політики може відрізнятисязалежно від характеру інциденту та в якому з моїх транспортних засобів. У контексті мого рішення ця інформація розміщена в таблиці, що знаходиться в документах про політичні документи, де рядки таблиці перераховують різні типи інцидентів, а стовпці перераховують різні транспортні засоби, на які поширюється поліс. Кожна комірка таблиці описує покриття для конкретної комбінації аварій / транспортного засобу.

Природним, що потрібно зробити, було б анотуватикожна комірка таблиці з відносинами до заголовків стовпців та рядків для цієї комірки. Я сподіваюся, що Watson Discovery вже робить це чи може це зробити для мене. Однак у своїх експериментах я не бачу результатів, які б вказували на це. Чи є у "Студії знань" Discovery або Watson Knowledge Studio, які полегшують використання інформації у заголовках рядків та стовпців, у межах таблиць?

Відповіді:

0 для відповіді № 1

Вміст таблиці є структурованими даними, а непідходить для WKS / Discovery для аналізу. WKS приймає звичайний текст природного тексту. Незважаючи на те, що Discovery приймає документ HTML / WORD / PDF, введений документ передується в звичайний текст заздалегідь, і всі структури таблиці будуть видалені. Тому відносини таблиці не враховуються в аналізі тексту. Я рекомендую обробляти такі дані вмісту таблиць як структуровані дані та обробляти їх іншими методами, наприклад програмно.