Закон Ціпфа

З пляцоўкі testwiki
Версія ад 11:04, 7 лістапада 2023, аўтар imported>Artsiom91 (выпраўленне сумесі раскладак)
(розн.) ← Папярэдн. версія | Актуальная версія (розн.) | Навейшая версія → (розн.)
Перайсці да навігацыі Перайсці да пошуку

Зако́н Ці́пфа (Зі́пфа) — эмпірычная заканамернасць размеркавання частаты сустракаемасці слоў натуральнай мовы ў вялікім тэксце. Закон Ціпфа быў вынайдзены Джорджам Ціпфам, які даказаў, што частата выкарыстання n-га найбольш часта выкарыстоўваемага слова ў натуральных мовах прыблізна зваротна прапарцыйная яго парадкаваму нумару n (рангу).

Сёння пад законам Ціпфа часцей за ўсё маюць на ўвазе заканамернасць ранг-частата, вядомую таксама як «універсальнае гіпербалічнае рангавае размеркаванне». Калі скласці спіс з усіх слоў тэксту і адсартаваць яго па парадку змяншэння частаты F выкарыстоўвання слоў, то для кожнага слова здабытак яго парадкавага нумара R у гэтым спісе на частату выкарыстання будзе роўны пастаяннай велічыні C.

C=F*R — у класічным выглядзе і C=F*RY — з папраўкай Мандельброта, дзе F — частата выкарыстання слова, R — парадкавы нумар; С — пастаянная велічыня, а Y — блізкая да адзінкі пераменная велічыня, якая змяняецца ў залежнасці ад параметраў тэксту.

Спасылкі

Шаблон:Бібліяінфармацыя