Skip to content

Latest commit

 

History

History
107 lines (71 loc) · 7.3 KB

README.md

File metadata and controls

107 lines (71 loc) · 7.3 KB

RuOpinionNE-2024 -- соревнование по извлечению кортежей мнений из русскоязычных новостных текстов

twitter

Содержание

Краткое описание

⚠️ Внимание: Полное описание представлено на платформе Codalab. Настоящее описание несет ознакомительный характер.

RuOpinionNE-2024 является продолжением тестирования RuSentNE-2023, в котором требовалось извлечение тональности предложения по отношению к заданной именованной сущности. Ключевые отличительные особенности постановки настоящей задачи приведены в формате указания входной и выходной информации.

Рисунок: пример извлечения кортежей мнений соревнования RuOpinionNE-2024; сущности входного текста не являются параметрами задачи, а лишь размечены визуально.

Входная информация включают в себя текст представляющий собой предложение из новостного текста с упомянутыми именованными сущностями.

Выходная информация настоящих соревнований предполагает извлечение кортежей мнений. В следующем подразделе рассмотрим более подробно формат представления кортежа мнений.

Кортеж мнения

Для заданного текста, кортеж мнения представляет собой структуру, состоящую из последовательности четырех значений:

  1. источник мнения: автор, именованная сущность текста (подстрока исходного текста), либо пустой;
  2. объект мнения: именованная сущность в тексте (подстрока исходного текста);
  3. тональность: положительная/негативная;
  4. языковое выражение: аргумент, на основании которого принята результирующая тональность (одна или несколько подстрок исходного текста);

Пример

⚠️ Внимание: Полное описание форматирования предложений представлено на платформе Codalab. Настоящее описание несет ознакомительный характер.

Для входного предложения и размеченных в нем именованных сущностей:

Премьер-министр Италии Маттео Ренци заявил, что с уходом Фо «страна потеряла крупнейшую фигуру культурной жизни»

Должен быть порожден следующий кортеж мнения:

(Маттео Ренци, Фо, pos, крупнейшую фигуру культурной жизни)

Данные соревнования

Коллекция включает в себя набор следующих файлов:

  • train.jsonl -- обучающие данные.
  • validation.jsonl -- данные валидационного этапа.
  • test.jsonl -- данные финального тестирования.

Полное описание формата представлено на платформе Codalab.

Соревнования на Codalab

Базовый подход

TODO: Baseline Approach Description.

Организаторы

Источники

Официальная информация по конференции Dialogue-2025

Репозиторий ранее проводимых соревнований RuSentNE-2023

Ссылки

TODO: Paper Reference once issued.