БлогNot. Список русских фамилий одним файлом :)

Помощь дата->рейтинг Поиск Почта RSS канал Статистика nickolay.info Домой

Список русских фамилий одним файлом :)

Файл может пригодиться как база данных, например, для генерации случайных фамилий. Я не утверждаю, что тут они все, но тысяч 250 набирается, формат, как всегда, простейший и удобный: одна строка - одна фамилия. Не всегда есть мужская и женская формы для фамилии. Фамилии, конечно, не только русские, а скорее российские, ТЕР-АВАГЛЫ, АБАШВИЛИ и ЛАСО-ТУЕВЕ Вы там тоже найдёте.

Формат файла - обычный .txt, верхний регистр, кодировка - кириллица Windows (CP-1251). Неверных символов, вроде случайно вкравшейся латиницы, кажется, нету. Буквы "ё", к сожалению тоже нету.

После сбора в начальный файл фамилии лежали "в беспорядке" и по много в одной строке, сделать нормальный список помог вот такой мини-скрипт на локалхосте:

<?php
 $f = fopen('fam.txt', 'rt');
 $f2 = fopen('fam2.txt', 'wt');
 $c=0;
 while (!feof($f)) { 
  $ws = explode(" ",trim(fgets($f)));
  foreach ($ws as $w) { fputs ($f2, trim($w)."\n"); $c++; }
 }
 fclose($f2); 
 fclose($f); 
 echo $c.' word(s)';
?>

с последующей "чисткой" списка моей утилитой SUS.

 250000 русских фамилий по алфавиту одним файлом .txt, открыть или скачать, 2.5 Мб

P.S. В онлайне "Яндекса" файл может не показывать фамилии из-за кодировки Windows вместо Юникода. При необходимости перекодируйте скачанный файл.


теги: список php язык

02.02.2014, 18:52; рейтинг: 17010

  свежие записипоиск по блогукомментариистатистикао "вирусах" в архивах .zip

Наверх Яндекс.Метрика
© PerS
вход