Различают следующие виды ошибок в русском языке [1, 2]:
- Отсутствие причинно-следственной связи: Обломов воспитывался в деревне, поэтому ничего не умел делать сам.
- Порядок слов в предложении, ведущий к искажению смысла: Есть немало произведений, повествующих о детстве автора, в мировой литературе. – В мировой литературе есть немало произведений, повествующих о детстве автора.
Бедность и однообразие синтаксических конструкций: Мужчина был одет в прожженный ватник. Он был грубо заштопан. Сапоги были почти новые. Носки изъедены молью. – Мужчина был одет в грубо заштопанный прожженный ватник, хотя сапоги были почти новые, носки оказались изъедены молью.
Расстояние Левенштейна
Расстояние Левенштейна, или расстояние редактирования между двумя строками – это минимальное количество операций вставки, удаления и замены символа на другой, необходимых для превращения одной строки в другую [3].
Пусть S1 и S2 – две строки длиной M и N соответственно. Тогда расстояние Левенштейна d(S1, S2) можно рассчитать по следующей рекуррентной формуле (первый элемент строки имеет номер 1):
где m(a, b) = 0 , если a = b, или 1 – в противном случае.
Здесь шаг по i символизирует удаление из первой строки, по j – вставку в первую строку, а шаг по обоим индексам символизирует замену символа или отсутствие изменений.
Справедливы следующий утверждения:
Методы автоматического поиска и исправления ошибок в предложении
Поиск слова в словаре
Выполняется поиск проверяемого слова в словаре, и если слово не найдено, то оно подчеркивается. Кандидаты на замену слова с ошибкой (ССО) определяются как слова из словаря, наиболее близкие к ССО. Близость устанавливается по расстоянию Левенштейна [4].
Достоинством метода является его простота.
- Нет автоматического исправления ошибок.
- Не учитывается контекст.
Пример: Microsoft Word. Приложение не исправляет слово с ошибкой, но предлагает выбор для его замены.
Прямой подход
Каждому слову русского языка сопоставляются всевозможные варианты ошибочных написаний, а также им присваиваются вероятности их появления (существуют наборы данных реальных ошибок пользователей и частота их появлений). Введенное слово с ошибкой исправляется на наиболее вероятное корректное слово.
Достоинством метода является простота использования.
- База ошибок постоянно расширяется.
- Не учитывается контекст.
Наивный подход
Вычисляются расстояния Левенштейна от слова с ошибкой до каждого слова словаря, а затем для замены из словаря выбирается слово с минимальным расстоянием Левенштейна. При обнаружении нескольких вариантов замен используются дополнительные критерии выбора. Этот способ правки необычайно дорог [5].
Стратегия промаха (Near-Miss Strategy). Подход Питера Норвига
Если слово не найдено в словаре, то генерируются все возможные комбинации слова с заданным расстоянием редактирования (операции удаления, перестановки, замены и вставки) и выполняется их поиск в словаре [6]. Если эти шаги приводят к слову, содержащемуся в словаре, то оценивается расстояние до исходного слова. Чтобы измерить близость слов, используется расстояние Левенштейна или одна из его модификаций [7]. Из числа найденных слов для замены выбирается слово с наименьшим расстоянием Левенштейна.
Метод весьма ресурсоемок. Так, для слова длины n, размера алфавита a, расстояния редактирования d = 1, будут выполнены n удалений букв, n – 1 перестановок, a * n изменений и a * (n + 1) вставок. В общей сложности число получаемых модификаций исходного слова равно 2n + 2an + a – 1. Число модификаций будет еще больше, если добавить операцию вставки пробела.
Этот способ хоть и лучше наивного подхода, однако все же весьма дорогостоящий по времени поиска и зависит от языка. Так для n = 9, a = 36, d = 2 получается 114 324 комбинации. Алфавит используется для генерации комбинаций, и он может быть очень большим. Так, в китайском языке а = 70’000 Unicode Han-символов.
Достоинство алгоритма: использование расстояния Левенштейна, что повышает точность ответов.
- Большое количество дочерних операций.
- Долгое время работы.
- Не учитывается контекст.
Пример: Спеллчекер Питера Норвига.
Орфографическая коррекция на основе симметричного удаления
Орфографическая коррекция на основе симметричного удаления (Symmetric Delete Spelling Correction — SymSpell) использует модификации исходного слова с заданным расстоянием редактирования, полученные только в результате применения операции удаления символа.
SymSpell использует тот факт, что расстояние между двумя выражениями симметрично: добавление символа в словаре эквивалентно удалению символа из входной строки и наоборот. Поэтому мы можем с обеих сторон ограничить преобразование только удалением.
Генерация модификаций слов словаря выполняется единожды на этапе инициализации SymSpell. Далее сгенерированные модификации проверяемого слова сравниваются с модификациями, полученными на предварительном этапе.
Рассмотрим следующий пример с заменой (в примере будет использоваться расстояние редактирования равное единице). Пусть в оригинальном словаре содержится слово тест. А было введено слово темт. В индексе, полученном на предварительном этапе, будут находится все «удаления» слова тест, а именно: ест, тст, тет, тес.
Для слова темт «удаления» будут следующими: емт, тмт, тет, тем. Поскольку удаление тет содержится в индексе, то это означает, что слову с опечаткой темт соответствует слово тест.
Число модификаций исходного слова, получаемых в результате удалений, не зависит от размера алфавита и вычисляется по следующей формуле:
где n – длина слова, d – расстояние редактирования.
Так, при n = 9, d = 2 получим x = 36, что на несколько порядков меньше аналогичного показателя стратегии промаха для тех же значений n и d: x = 114’324.
Обобщая вышесказанное, можно утверждать, что стоимость данного подхода заключается лишь во времени предварительного расчета и объеме хранилища для всех удалений каждого слова в словаре.
Таким образом, например, для максимального расстояния редактирования 2 и средней длины слова в 5, и 100 000 записей в словаре необходимо дополнительно сохранить 1’500’000 «удалений».
Система исправления ошибок, использующая рассматриваемый подход, включает следующие таблицы:
— словарь с правильными написаниями слов;
— таблицу всех модификаций слов словаря.
Таблица модификаций исходных слов формируется по следующему алгоритму:
- Последовательно выбирается слово из словаря правильных написаний, а текущее расстояние редактирования присваивается равное 0.
- Текущее расстояние редактирования увеличивается на 1
- В цикле по порядку из данного слова удаляется одна буква. В результате этого шага получается ровно n выражений-модификаций исходного слова, где n – количество букв в исходном слове. Полученные модификации запоминаются в списке всех удалений этого слова с указанием исходного слова и текущего расстояния редактирования, в том случае, если он еще не содержит такой модификации.
- Если максимальное расстояние редактирования больше текущего, то алгоритм запускается рекурсивно (переход к шагу 2) для каждого выражения-модификации, полученного на шаге 3.
- Внесение записей из списка всех удалений данного слова в таблицу удалений и переход к шагу 1.
Замечание. В алгоритме учтено, что разные слова в словаре могут приводить к одной и той же модификации.
В рассматриваемом подходе список кандидатов на замену слова с ошибкой формируется по следующему алгоритму:
- Исходное слово сравнивается с записью в словаре правильных слов. Если существуют совпадения, то алгоритм завершается (в этом случае слово написано правильно). Иначе – переход к следующему шагу.
- Исходное слово сравнивается с записями в словаре удалений. Если совпадение найдено, то в список кандидатов для этого слова запоминается слово, указанное в качестве исходного для данного удаления. Далее – переход к следующему шагу.
- Удаления исходного слова сравниваются с записью в словаре правильных слов. Если совпадение найдено, в то в список кандидатов этого слова запоминается найденное совпадение (в этом случае пользователь мог ввести лишние буквы).
- Удаления исходного словари сравниваются с записями в словаре удалений. Если совпадение найдено, то в список кандидатов для исходного слова запоминается слово, указанное в качестве исходного для данного удаления в словаре удалений.
- Далее список кандидатов сортируется сначала по расстоянию Левенштейна до исходного слова, затем по частоте встречаемости.
В качестве исправления исходного слова, используется первое слово в отсортированном списке кандидатов.
Ускорение поиска в таблице модификаций и в словаре достигается за счет их индексирования. Для выбора замены из списка кандидатов можно использовать частоту встречаемости слов, которую можно хранить в словаре.
Приведенный алгоритм формирования списка слов-кандидатов является достаточно быстрым, о чем говорят следующие факторы:
- Существует предварительное вычисление, то есть происходит создание всевозможных вариантов орфографических ошибок, связанных с пропуском буквы заранее.
- Наличие быстрого поиск по индексу во время запроса к базе данных.
- Лишь одно только использование алгоритма орфографической коррекция на основе симметричного удаления позволяет довести вычислительную сложность алгоритма до О(1), поскольку он позволяет значительно сократить количество кандидатов на орфографическую ошибку, которые должны быть предварительно рассчитаны (сгенерированы и проиндексированы).
- Применение предварительного расчета к подходу Норвига было бы невозможным, поскольку предварительное вычисление всех возможных удалений, перестановок, замен и вставок кандидатов всех выражений приведет к огромному расходу времени и памяти.
Если индекс основан на таблице хэшей, поиск по которой занимает константное О(1) время, то алгоритм SymSpell имеет вычислительную сложность О(1), в то время как, например, алгоритм, основанный на BK-деревьях имеет вычислительную сложность О(log(размер_словаря)) [4, 8].
Использование правил (rule-based подход)
Является модификацией стратегии промаха. Описываются всевозможные правила согласования слов русского языка, с учетом их морфологических признаков. Среди кандидатов на исправление опечаток выбирается тот, который наилучшим образом подходит описанным правилам.
Достоинство: учет контекста.
Недостаток: сложность (почти невозможность) реализации.
Использование модели языка (модифицированная стратегия промаха)
Модель языка умеет отвечать на вопрос, с какой вероятностью данное предложение может встретится в языке. На сегодняшний день в основном используются два подхода: модели на основе N-грамм [9] и применение искусственного интеллекта на основе нейросетей [10].
а) N-граммная модель.
N-грамма – это последовательность из n элементов. Например, последовательность звуков, слогов, слов или букв.
N-граммная модель работает следующим образом. По тексту, используемому для обучения модели, проходим окном размером в N слов и подсчитываем количество обнаружений каждой n-граммы. При запросе к модели аналогичным образом проходим окном по предложению и считаем произведение вероятностей всех n-грамм. Вероятность встретить n-грамму оцениваем по количеству таких n-грамм в обучающем тексте.
Вероятность P(w1, . wm) встретить предложение (w1. wm) из m слов примерно равна произведению всех n-грамм размера n, из которых состоит это предложение:
Вероятность каждой n-граммы определяется через количество обнаружений n-граммы по отношению к количеству нахождений такой же n-граммы, но без последнего слова:
На практике в чистом виде такую модель не используют, так как у неё есть следующая проблема. Если какая-то n-грамма не встречалась в обучающем тексте, то всё предложение сразу же получит нулевую вероятность. Для решения этой проблемы используют один из вариантов сглаживания. В простом виде – это добавление единицы к частоте встречаемости всех n-грамм, в более сложном – использование n-грамм более низкого порядка при отсутствии n-граммы высокого порядка.
Самая популярная техника сглаживания – Kneser–Ney smoothing [11]. Однако она требует для каждой n-граммы хранить дополнительную информацию, а выигрыш по сравнению с более простым сглаживанием получается незначительным (по крайней мере в экспериментах с небольшими моделями, до 50 миллионов n-грамм). Для простоты в качестве сглаживания будем считать вероятность каждой n-граммы как произведение n-грамм всех порядков, например, для триграмм:
Теперь, имея модель языка, будем выбирать среди кандидатов на исправление опечаток того, для которого модель языка с учетом контекста будет выдавать наилучшую оценку. Кроме того, добавим к оценке небольшой штраф за изменение исходного слова, чтобы избежать большого числа ложных срабатываний. Изменение данного штрафа позволяет регулировать процент ложных срабатываний: например, в текстовом редакторе можно оставить процент ложных срабатываний выше, а для автоматического исправления текстов ниже.
Достоинство алгоритма: учет контекста.
- Сложность реализации.
- Достаточно большое количество дочерних операций.
- Долгое время работы.
б) Модель на основе ИИ.
Для учета контекста можно использовать нейросеть типа LSTM (Long Short Term Memory) – нейросеть с короткой и длинной памятью [12]. Суть LSTM в том, что нейроны этой сети имеют определенный параметр, который запоминает, о чем идет речь в том или ином предложении [13, 14]. Важным аспектом является то, какие слова в предложении значимы, а какие нет. Для этого используется NLP (Natural Language Processing) – обработка естественного языка. Техника NLP позволяет определить интонацию предложения, понять, о чем идет речь, и выделить ключевые слова.
Достоинство: учет контекста.
Недостаток: сложность реализации.
Примеры: Spell-Checker [15], Яндекс.Спеллер – использует машинное обучение и библиотеку машинного обучения CatBoost [16].
Фонетический алгоритм
Алгоритм пригоден для исправления орфографических ошибок. Все буквы можно разбить на классы эквивалентности по принципу фонетической близости звуков, которым они соответствуют. В границах каждого класса существует некоторая не очень маленькая вероятность того, что на месте одной буквы класса пользователь, совершив ошибку, напишет другую. Выбрав из каждого класса одного представителя и заменив все буквы в слове на представителя их класса, получаем фонетическую метку [17].
Здесь и далее фонетические метки на любой стадии обработки будут заключаться в угловые скобки. Ошибочное написание слов будет предваряться знаком *.
Правила компиляции фонетической метки:
1. Слитно, раздельно, через дефис.
Большой класс орфографических ошибок – написание раздельно/слитно/через дефис. Поэтому при компиляции фонетической метки все символы, кроме русских букв, удаляются. Этот пункт применим к словарным записям, представляющих собой устойчивые группы из нескольких слов, например, «потому что»; «в течение»; «за границу».
Например:
- по-разному → ;
- потому что → ;
- в течение → ;
- за границу → .
- *иЗСкуЗСтво;
- француЗСкий (самое популярное неправильное написание *французкий).
- cЪедобный → ;
- площадЬ → .
- стн → сн: местный, честный, безызвестный, искусный;
- ндш → нш: ландшафт, мундштук, эндшпиль;
- стл → сл: счастливый, жалостливый, совестливый;
- здн → зн: поздно, бездна, праздник;
- вств → ств: здравствуй, чувствовать, баловство, колдовство.
- здц → сц: под уздцы;
- лнц → нц: солнце;
- ндц → нц: голландцы;
- нтг → нг: рентген;
- рдц → рц: сердце;
- рдч → рч: сердчишко.
- сч, зч, жч, сш, сщ, тч → ш (*сЩастье, *закаЩик, *муЩина, *сумаШедший, *АЩистка);
- стг → сг (*бюЗгалтер);
- хг → г (*буГалтер, *двуГодичный, *трёГлавый);
- тс, дц → ц (*деЦтво, *богаЦтво, *спорЦмен).
- a, о, ё → а;
- ю, у → у;
- я, ы, и, е, э → и.
Рис. 1. Тепловая карта букв «я» и «ё» и их ошибочных написаний
Фонетически буква «Ё» может передавать два звука «ЙОТ»-«О». И если посмотреть по статистике пользовательских ошибок, то пара «Ё»-«О» является наиболее вероятной. Но на практике, если ваш словарь не содержит буквы Ё или пользователи не используют Ё при вводе, то лучше сводить «Ё» к «И»-классу (ы, и, е, э).
Буква Я, по аналогии, может передавать два звука «ЙОТ»-«А». Но по статистике люди чаще, совершая ошибку, пишут «Е» или «И» вместо «Я» (*премая, *кипеток, *выпримлять). Так что отнесение «Я» к «И»-классу (ы, и, е, э) однозначно будет более выгодным.
Если уточнить, то после шипящих и Ц более вероятной будет как раз ошибка А-Я. (Наоборот быть не может – в русской орфографии после этого класса согласных (шипящие и Ц) Я никогда не пишется.) Это правило можно встроить в алгоритм.
Буквы, предшествующие обозначенным на тепловой карте парам эталон-ошибка, показаны на рис. 2.
Рис. 2. Тепловая карта пар эталон-ошибка и предшествующим им буквам
- б → п;
- з → с;
- д → т;
- в → ф;
- г → к.
- Простота использования.
- Можно использовать везде, где есть быстрый поиск по индексу.
- Низкая точность (примерно 25%).
- Пользователю предлагается на выбор несколько вариантов исправлений.
- Неумение работать с опечатками, пропусками и лишними буквами.
Примеры: Soundex, Metaphone, Double Metaphone.
Использование префиксных деревьев
Структура дерева имеет следующий вид: каждый узел представляет собою пару «ключ, значение». В ключе записываются буквы слов, а значениями являются элементы дерева [18].
Пары «ключ, значение» формируются следующим образом: берётся первый символ слова, записываем в ключ узла, далее получаем ссылку на соответствующее поддерево (при необходимости оно тут же и создаётся). Рекурсивно записываем остаток строки в это поддерево. Когда строка исчерпана, к последнему узлу добавляется «знак остановки» – ключ ‘$’ с пустым поддеревом.
Если представить дерево как некую многократно разветвляющуюся дорогу, то функция поиска слова – путник, идущий по этой дороге. Путнику дан маршрут (искомое слово), и в соответствии с ним он переходит от узла к узлу, зачеркивая пройденные буквы маршрута. Если буквы кончились, остаётся проверить, виден ли «знак остановки».
Теперь представим, что клоны путника одновременно отправляются во все стороны сразу. Каждый из его клонов на каждой развилке действует по одной схеме, и так до тех пор, пока в каждую из конечных остановок (то есть листьев дерева) кто-нибудь не придёт. Общее количество клонов путника равно количеству слов, записанных в дерево, и каждый из них пройдёт по индивидуальному пути.
Пусть всем им изначально задано одно и то же слово-маршрут. При каждом переходе каждый путник, как и раньше, зачеркивает по одной букве в своей копии маршрута. Но если реальное направление перехода не совпадает с зачёркнутой буквой, путник получает штраф. В результате в конце пути у каждого будет накоплена некоторая задолженность. Выстроим всех в ряд, отсортировав по возрастанию этой величины.
Если искомое слово присутствует в словаре, то один путник пройдёт весь путь без штрафов – в отсортированном списке он будет первым. Если слово в словаре отсутствует, то лидировать будет тот, кто прошёл путь с минимальным количеством нарушений.
Смысл в том, что путь, пройденный лидером, будет ближайшим исправлением заданного слова (или самим этим словом, если опечаток нет), а количество нарушений (отклонений от заданного маршрута) – количеством опечаток. Таким образом осуществляется нечеткий поиск.
Достоинства алгоритма:
- Несложный, но эффективный механизм исправления опечаток.
- Хорошо подходит для автозаполнения или вывода вариантов-подсказок.
- Все слова равны между собою, что приводит к неточностям в выборе лучшей гипотезы.
- Нет учета контекста.
Использование векторного представления слов
В [19] проектируется нейронная сеть, находящее слово по его левому контексту. В системах проверки правописания это слово может быть использовано для пополнения списка кандидатов на замещение слова с ошибкой. Предварительно по технологии word2vec в [19] создается словарь с векторным представлением слов.
Далее проектируется и обучается нейронная сеть, принимающая на входе левый контекст слова и выдающая на выходе слово, с наибольшей вероятностью отвечающее этому контексту. После этого в word2vec-словаре находятся слова, семантически близкие в полученному от нейронной сети слову. Из этих слов предлагается выбрать слово, продолжающее полученный на входе нейронной сети левый контекст. Глубина левого контекста, взятая в [19], равна 1 (на вход сети подается одно слово).
- Быстрый поиск слова.
- Возможность формирования подмножества семантически близких слов по ранее найденному слову.
- Низкая точность определения word2vec-координат редко встречающихся слов.
- Малый размер выхода нейронной сети (равен одному слову) – из множества продолжений контекста всегда будет выбрано одно слово.
Литература
Источник: www.100byte.ru
Понятия стилистической ошибки и недочета
Стилистические смешения – это особая группа речевых недочетов. К ним относится все, что разрушает единство стиля высказывания: употребление иностилевых слов и выражений, неудачное использование экспрессивных, эмоционально окрашенных средств, немотивированное применение диалектных и просторечных слов и выражений, смешение лексики разных исторических эпох.
Стилистические смешения составляют разновидность речевых нарушений, объединяющую самые тонкие случаи. Поэтому лучше их называть стилистическими недочетами, а не ошибками.
Необходимо разграничить понятия «ошибка» и «недочет».
Ошибка — это нарушение требования правильности речи.
Ошибка расценивается с позиции «правильно или неправильно сказано или написано». О ней мы говорим: так сказать (или написать) нельзя, это неправильно.
Недочет — это нарушение требований хорошей речи, т.е. точности, выразительности, богатства речи.
Недочет мы расцениваем с позиции «хуже или лучше сказано или написано». О нем мы говорим: вообще-то так можно сказать, но лучше сказать иначе.
С этой точки зрения все орфографические, пунктуационные и грамматические нарушения являются ошибками; речевые же могут быть как ошибками, так и недочетами. Например, употребление слова в несвойственном ему значении, нарушение видо-временной соотнесенности глагольных форм или смешение причастий действительно и страдательного залога – все это примеры речевых ошибок. Другие же, менее грубые речевые нарушения: повторение одного и того же слова, однообразие конструкций, неудачный порядок слов, различного рода стилевые смешения и т.д. – правильнее считать речевыми недочетами.
Грамматические ошибки — это ошибки, связанные с нарушением грамматических норм: норм склонения и спряжения, согласования слов, построения предложений той или иной структуры.
Грамматические ошибки могут быть трех видов:
1. словообразовательные: нарушена структура слова;
2. морфологические, или формообразовательные: нарушена форма слова;
3. синтаксические: нарушена структура словосочетания или предложения.
Внутри каждого вида грамматических ошибок имеются разновидности. Например, разновидностями морфологических ошибок являются:
· ошибки в образовании падежной формы существительного: «сапогов» вместо «сапог»;
· ошибки в образовании личной формы глагола: «бежат» вместо «бегут» и др.
Все эти виды и разновидности объединяются в один тип, тип грамматической ошибки, на том основании, что это ошибки в структуре, в образовании языковой единицы.
Для обнаружения грамматической ошибки не требуется контекст. Так как ошибка локализуется в пределах самой языковой единицы. Чтобы обнаружить грамматическую ошибку в слове достаточно одного этого слова, Чтобы обнаружить грамматическую ошибку в структуре словосочетания, достаточно одного этого словосочетания. Чтобы обнаружить грамматическую ошибку в структуре предложения, достаточно одного этого предложения.
Грамматическая правильность речи оценивается так же, как и орфография с пунктуацией, так как вместе с ними она составляет понятие «грамотность речи». Грамматические ошибки необходимо отличать от орфографических:
· если погрешность заметна и в устной и в письменной речи, значит это грамматическая ошибка;
· если погрешность заметна только в письменной речи, значит, в тексте допущена орфографическая ошибка.
15.
Выразительная речь – это речь, способная поддерживать внимание, возбуждать интерес слушателя (или читателя) к сказанному (написанному). Главное условие выразительности – наличие у автора речи своих чувств, мыслей, своей позиции, своего стиля. Выразительность обычно подразумевает оригинальность, неповторимость, неожиданность. В этом плане выразительная речь – речь всегда новая, «свежая», творческая. Именно этим она способна вызвать интерес и одобрение у тех, кому она предназначается.
Не приходится говорить о каком-либо большом воздействии речи, если оратор говорит невнятно, сиплым, еле слышным голосом, нечетко произносит слова, т.е. не владеет элементарной техникой речи. Владение техникой речи – это фундамент культуры речи.
Составные части техники речи – дикция, дыхание, голос.
Каждое слово, а в слове каждый звук должны произноситься четко – таково главное требование дикции.
Нечеткая, неряшливая, неграмотная речь неприятна в быту. Она оскорбляет наш слух, наше эстетическое чувство. Но уже совершенно недопустима она для лектора.
Недостатки дикции (если только они не связаны с какими-то недостатками речевого аппарата) – это результат укоренившейся с детства дурной привычки говорить “лениво”, небрежно, вяло произносить слова. Поэтому, чтобы устранить эти недостатки, нужно контролировать, как говоришь, читая лекции, выступая на собрании, в быту (не комкаешь ли слова, не “глотаешь” ли окончания, не цедишь ли слова сквозь зубы и т.д.).
Для оратора важен голос, его тембр, оттенки. Сила голоса не имеет решающего значения, но следует иметь в виду, что аудиторию (слушающих) утомляет, усыпляет как очень тихий, так и громкий голос. Важен тон речи. Речь не должна быть высокомерной, поучительной.
Смысловое восприятие речи во многом зависит от темпа речи. Определяя восприятие как встречный процесс мышления, мы обязаны учесть два момента: слушателю нужно успеть осознать поступающую информацию и запомнить основные положения того, о чем говорят.
По экспериментальным данным, оптимальное условие легко воспринимаемой речи – средний темп произношения.Особенно внимательно нужно относиться к выразительной роли интонации (высота, сила, тембр, темп речи, паузы). Существует гипотеза о том, что интонация предшествовала языкуИнтонация позволяет подчеркнуть логическую и эмоциональную значимость высказывания. Чем ярче эмоциональная отзывчивость человека, тем богаче его речь мелодичной выразительностьюДля интонации важным является соблюдение пауз. Гладкая речь производит иногда впечатление заученности, поэтому может не нравиться слушателям, и некоторые ораторы, чтобы создать впечатление импровизированной речи, используют паузы припоминания..Для того, чтобы речь была выразительной, используют пословицы, поговорки, афоризмы, а также тропы: метафоры, сравнения гиперболы, эпитеты. Однако следует помнить, что этими изобразительными средствами не следует злоупотреблять.
Под уместностью речи понимают строгое соответствие ее структуры условиям и задачам общения, содержанию выражаемой информации, избранному жанру и стилю изложения, индивидуальным особенностях автора и адресата.
Уместность – функциональное качество речи, в его основе лежит идея целевой установки высказывания. В лингвистической литературе последних лет принято выделять уместность стилевую, контекстуальную, ситуативную и личностно-психологическую или уместность, обусловленную: а) внеязыковыми и б) внутриязыковыми факторами.
Стилевая уместность
Каждый функциональный стиль характеризуется специфическими для него закономерностями отбора, организации и употребления языковых средств, и вопрос об употреблении той или иной языковой единицы, о ее уместности (или неуместности) в каждом стиле решается по-разному. Так, если в официально-деловом и научном стилях, как правило, используются общеупотребительные, нейтральные и книжные языковые средства, то в публицистике с особым стилистическим заданием могут употребляться и разговорные элементы (в ограниченных пределах – даже жаргонно-просторечные).Например: Недавно в переулке Козлова в Минске задушили еще одного «извозчика».
За что? Чтобы приобрести очередную партию спиртного. Вычистив карманы жертвы, убийцы преспокойно продолжили пирушку (из газет).Свои особенности имеет представление об уместности языкового факта в стиле художественной литературы. Здесь допустимы отступления от норм общелитературного языка.
Главный критерий их уместности в том или ином произведении – обоснованность целевой установкой автора, функциональная целесообразность. Поскольку употребление языковых средств в произведениях художественной литературы подчинено авторскому замыслу, созданию художественного образа, функции эстетического воздействия, уместными могут быть самые разнообразные языковые средства.
Ситуативно-контекстуальная уместность – употребление языкового материала в зависимости от ситуации общения, стиля высказывания, речевого окружения языковой единицы. Основным критерием ситуативно-контекстуальной уместности являются ситуация и задачи речевого общения. «Нельзя говорить одними и теми же словами, одними и теми же предложениями с ребенком пяти лет и со взрослым человеком: необходим отбор языковых средств, соответствующих возможностям ребенка и уровню развития взрослого человека; нельзя обойтись одним и тем же набором языковых средств, создавая лирическое стихотворение и роман в прозе».
Выбор языковых средств определяется темой, жанром, целевой установкой автора. Немаловажное значение имеет также адресат речи: автор должен четко представлять себе того, кому он адресует свою речь (возраст адресата, его социальное положение, культурный и образовательный уровень).
Ситуативно-контекстуальная уместность тесно связана со стилевой. В общих чертах она определяется последней. Однако в конкретных условиях общения она не совпадает с ней: языковые средства, не характерные для какого-то стиля, в определенном контексте, в определенной ситуации, оказываются уместными, даже необходимыми, единственно возможными
Стилистически немотивированное употребление языковых средств приводит к нарушению уместности речи. Нарушением уместности является употребление стилистически маркированных единиц без учета их функциональной и эмоционально-экспрессивной окраски, немотивированное разрушение единства стиля. Например, неоправданное употребление слов и словосочетаний официально-делового стиля (канцеляризмов) в других стилях, употребление анахронизмов (перенесение слов и устойчивых словосочетаний из одной эпохи в другую), замена литературного языкового элемента просторечным и т.д.
Нарушением критерия уместности является также перенасыщение речи (в особенности – художественной) специальными терминами.Технические, профессиональные термины, значение которых непонятно неспециалисту, не выполняют в приведенном контексте никакой эстетической функции, они функционально нецелесообразны, а следовательно, и неуместны.
Личностно-психологическая уместность предполагает внутреннюю вежливость, тактичность, отзывчивость, заботливое отношение к собеседнику, умение вовремя подумать о его настроении, учесть его индивидуально-психологические особенности, умение найти в той или иной ситуации нужное слово, необходимую интонацию, способствует установлению правильных взаимоотношений собеседников, является залогом морального и физического здоровья людей.
17. Понятие функционального стиля. Классификация стилей.
Функциональный стиль — это исторически сложившаяся и общественно осознанная разновидность литературного языка (его подсистема), функционирующая в определенной сфере человеческой деятельности и общения, создаваемая особенностями употребления в этой сфере языковых средств и их специфической организацией.
Стиль -это структурно-функциональный вариант лит-го языка, или определяется сфера функционирования и характерные для него стилевые черты и языковые особенности.
Офиц деловой стиль — это структурно –функциональный вариант лит-гоязыка,который действует в сфере административно-правовой деятельности. Он реализуется в текстах док-ов и деловой переписки учреждений.
Офиц деловой стиль:
3)Виды делового общения
Постиля:
1.законодательный-(сближается с научным)
2.канцелярский-(нет в переписке между учреждениями)
3.дипломатические-(действует в области международных отношений)
Основные стилевые черты:
1.высокая степень точнсти
2.неличный характер изложения.
4.высокая степень нормативности
Источник: cyberpedia.su
Что такое стилистические ошибки в тексте
По словарю С.И. Ожегова: Лексика, -и, ж. Словарный состав языка, какого-н. его стиля, сферы, а также чьих-н. произведений, отдельного произведения. Русская л. Просторечная л. Л. Пушкина. II прил. лексический, -ая, -ое. 6
Лексика — это не просто множество единиц языка, а система взаимосвязанных и взаимообусловленных элементов одного уровня. Слова объединены в группы по определенным признакам. Например, могут выделяться тематический, лингвистический уровни организации слов, объединенных какой-либо сферой употребления или принадлежностью к одним грамматическим признакам. Такие системные отношения в группах слов называются парадигматическими. Примером этого могут служить: антонимы, синонимы, омонимы и паронимы. 7
1.1.1 Лексические речевые ошибки8
Использование слова (исконно русского или заимствованного) без учета его значения
Неудачный выбор синонимов
Неумелое пользование антонимами
Ошибка принимает разные формы:
— неверное попарное объединение однородных членов предложения
— непреднамеренное столкновение в одном контексте слов, имеющих противоположное значение
— противопоставление понятий, которые на самом деле не являются противоположными.
Смешение паронимов — слов, близких по звучанию (обычно однокоренных), но разных по значению
Ошибки в использовании омонимов — слов, одинаково звучащих, но имеющих разное значение, — и полисемантичных слов
Плеоназм (лексическая избыточность)
Речевая недостаточность — пропуск слова, необходимого для раскрытия авторской мысли
Тавтология — повторение одних и тех же или однокоренных слов в непосредственной близости друг от друга
Нарушение норм лексической сочетаемости. Лексическая сочетаемость имеет ограничения.
Ошибки в использовании фразеологических оборотов:
Неудачные авторские неологизмы (новые слова)
— употребление устойчивого сочетания без учета его значения
— искажение фразеологизма (замена какого-либо слова, сокращение или расширение компонентного состава)
— контаминация (соединение частей разных фразеологизмов в один)
— неудачный фразеологический каламбур (проявление прямого значения к фразеологизма и проявление фразеологического значения у свободного сочетания слов
1.1.2 Собственно стилистические лексические ошибки9
Необоснованное употребление стилистически сниженной (разговорной, просторечной) лексики
Использование грубой, в том числе оскорбительной лексики
Неоправданное использование жаргонизмов, диалектизмов — слов, относящихся к лексике ограниченного употребления
Употребление в одном контексте слов с разной эмоционально-оценочной окраской,
Необоснованное использование в нейтральном тексте слов и устойчивых сочетаний, имеющих книжную, высокую окраску
Немотивированное употребление в современной речи архаичной, устаревшей лексики
Употребление канцеляризмов (слов официально-делового стиля) в текстах других стилей
Ошибки в использовании образных средств — неудачно построенные образы, нагромождение противоречащих друг другу образов в одном предложении
Языковые штампы — слова и устойчивые выражения, претендующие на образность, но утратившие ее из-за неумеренной «эксплуатации» этих выражений журналистами и писателями
Засорение речи словами-паразитами (слова, потерявшие присущее им в языке вполне конкретное значение и использующиеся в речи «для связки слов», для заполнения пауз,
Источник: studbooks.net
