БлогNot. Список русских фамилий одним файлом

Список русских фамилий одним файлом

Файл может пригодиться как база данных, например, для генерации случайных фамилий.

Я не утверждаю, что тут они все, но тысяч 250 набирается, формат, как всегда, простейший и удобный: одна строка - одна фамилия. Не всегда есть мужская и женская формы для фамилии. Фамилии, конечно, не только русские, а скорее российские, ТЕР-АВАГЛЫ, АБАШВИЛИ и ЛАСО-ТУЕВЕ Вы там тоже найдёте.

Формат файла - обычный .txt, верхний регистр, кодировка - utf-8 (Юникод).

Неверных символов, вроде случайно вкравшейся латиницы, кажется, нету. Буквы "ё", к сожалению тоже нету.

После сбора в начальный файл фамилии лежали "в беспорядке" и по много в одной строке, сделать нормальный список помог вот такой мини-скрипт на локалхосте:

<?php
 $f = fopen('fam.txt', 'rt');
 $f2 = fopen('fam2.txt', 'wt');
 $c=0;
 while (!feof($f)) { 
  $ws = explode(" ",trim(fgets($f)));
  foreach ($ws as $w) { fputs ($f2, trim($w)."\n"); $c++; }
 }
 fclose($f2); 
 fclose($f); 
 echo $c.' word(s)';
?>

с последующей "чисткой" списка моей утилитой SUS.

 250000 русских фамилий по алфавиту одним файлом .txt, открыть или скачать, 4.4 Мб


теги: язык список php

показать комментарии (2)

02.02.2014, 18:52; рейтинг: 22248