Модели, алгоритмы и система автоматизированного реферирования текстовых документов на арабском языке

Категория
Автор
Билал Сомар
Издательство
ДГТУ
Назначение
научный доклад
Год издания
2024 г.

Для скачивания файла, Вам необходимо зарегистрироваться или авторизоваться, если у Вас уже имеется учетная запись.

Суммаризация текста включает в себя извлечение существенных элементов из широкого спектра текстовых материалов, таких как обзоры в интернете, документы, блоги, обновления в социальных сетях и новостные статьи. Цель заключается в создании краткого, но точного обзора обширных текстов, позволяя системам выделять части, богатые ценной информацией, сохраняя при этом первоначальный замысел. Эти системы предназначены для сокращения длинных документов до более удобоваримых, сокращенных форм, стремясь произвести гладкое и связное абстрактное изложение, которое захватывает все критические данные. Суммаризации могут быть созданы вручную или посредством автоматизированных процессов. Создание суммаризаций вручную часто медленно и утомительно, в то время как инструменты автоматической суммаризации набрали популярность по мере роста объема текстового контента в интернете. В областях машинного обучения (Machine Learning (ML)) и обработки естественного языка (Natural Language Processing (NLP)), автоматическая суммаризация текста принимает вызов сжатия больших текстов в точные, понятные суммарии, которые эффективно передают основные сообщения. С огромным количеством информации, циркулирующей в сети, существует настоятельная потребность в моделях машинного обучения, способных эффективно сокращать тексты и предоставлять четкие суммарии. Понимание необходимости автоматизированной суммаризации является ключевым перед изучением различных доступных методологий.