Войти в систему

Home
    - Создать дневник
    - Написать в дневник
       - Подробный режим

LJ.Rossia.org
    - Новости сайта
    - Общие настройки
    - Sitemap
    - Оплата
    - ljr-fif

Редактировать...
    - Настройки
    - Список друзей
    - Дневник
    - Картинки
    - Пароль
    - Вид дневника

Сообщества

Настроить S2

Помощь
    - Забыли пароль?
    - FAQ
    - Тех. поддержка



Пишет r_l ([info]r_l)
@ 2013-11-21 16:16:00


Previous Entry  Add to memories!  Tell a Friend!  Next Entry
Братья и сестры!
У меня есть файл, хи-хи, экзеля, в котором забито всякое.
Никто не знает, можно ли там (или где-нибудь вовне) перестроить его по частотностям идентичных записей в разных колонках.
(Ну вот если у меня, скажем, в колонке "имя" есть n Маш, m Коль и l Ли, причем l>n>m, есть ли инструменты сортировки, чтобы Ли стали первыми, Маши вторыми, а Коли третьими?).
Заранее спасибо.


(Добавить комментарий)


[info]_ok_66_
2013-11-21 18:42 (ссылка)
Если надо посчитать частоту в колонке А с 1 по 13 строки, то вставляем в первую строку другой колонки формулу =СЧЁТЕСЛИ(A$1:A$13;"="&A1) и протягиваем до 13 строки. Получаем колонку с частотой записей. Дальше понятно

(Ответить) (Ветвь дискуссии)


[info]r_l
2013-11-21 18:46 (ссылка)
У меня там 10 с половиной тысяч строк.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]_ok_66_
2013-11-21 18:50 (ссылка)
Двойной щелчок на правом нижнем углу ячейки размножает формулу до первой пустой ячейки соседнего столбца слева. Ваш кэп.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]r_l
2013-11-21 19:09 (ссылка)
Так, у меня какой-то архаический офис вообще. Типа 2003. Волнуюсь, Рабинович. Спасибо.

(Ответить) (Уровень выше)


[info]mipa
2013-11-21 19:08 (ссылка)
Нормально считает. Проверил на i5-2400: пара секунд на 9216 записей. Но это Excel 2013, если старый, 2003, то будет медленней гораздо: он не умеют многопоточно.

А формулу заполнить уже сказали ниже как.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]_ok_66_
2013-11-21 19:16 (ссылка)
Для ускорения можно перед сортировкой заменить в этой колонке формулы значениями.

(Ответить) (Уровень выше)


[info]r_l
2013-11-21 19:56 (ссылка)
Не, сдаюс. Там какой-то не вполне человеческий экзеловский файл, сделано филологами.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]_ok_66_
2013-11-21 20:04 (ссылка)
М.б. вышлете и укажете по каким колонкам посчитать частоту?

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]r_l
2013-11-21 20:12 (ссылка)
Буду очень признателен, особенно если расскажете, как его вообще привести в сознание и как это рационализировать; сейчас он какая-то небаза неданных, скорее. Это черновик, там возможны всякие мелкие глупости с вариациями заглавий и опечатками, но хотя бы его хочется обработать по
1. частоте упоминаемых авторов (B)
2. частоте названий текстов (C)
http://unclear.rinet.ru/~r_l/canon/Hrestomatii_count.xls
Это делал не я, но я бы, наверное, тоже сделал что-то монструозное.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]_ok_66_
2013-11-21 20:42 (ссылка)
После удаления пустых строк (числом около десятка) всё заработало. Естественно, "Бенитцкий" и "Бенитцкий " трактуются как два разных автора. На первом месте по частоте (внезапно) Пушкин (1575) и "Пророк" (53). Последний результат - сумма лермонтовского и пушкинского.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]r_l
2013-11-21 20:45 (ссылка)
Покажите, покажите!

(Ответить) (Уровень выше)


[info]r_l
2013-11-21 20:45 (ссылка)
roman.leibov@g

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]_ok_66_
2013-11-21 20:57 (ссылка)
Ушло, ловите.

(Ответить) (Уровень выше)


[info]mipa
2013-11-21 20:49 (ссылка)
Вроде сделал. Можно скачать на http://sdrv.ms/1hZImI3

1. Исходник с формулами: Hrestomatii_count-formulas (прямо в браузере лучше не открывать, тыкнуть правой кнопкой и скачать)
2. Уже отсортировано по-всякому на разных листах, без формул: Hrestomatii_count-values

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]r_l
2013-11-21 20:53 (ссылка)
Спасибо огромное.
Прошу частным порядком сообщить ФИО для принесения признательности. Адрес см. выше.

(Ответить) (Уровень выше)


[info]r_l
2013-11-21 21:05 (ссылка)
Спасибо, поймато.

(Ответить) (Уровень выше)


[info]r_l
2013-11-21 21:28 (ссылка)
Имя, брат, имя!

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]mipa
2013-11-21 21:35 (ссылка)
Отправил ;)

(Ответить) (Уровень выше)


[info]_ok_66_
2013-11-21 20:52 (ссылка)
Интересный глюк - "К ***" Василия Львовича программа уравнивает со всеми прочими "К...". Лечится убиранием трёх звёздочек.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]r_l
2013-11-21 20:54 (ссылка)
Прошу тайно сообщить ФИО для экноледжмента!

(Ответить) (Уровень выше)


[info]mipa
2013-11-21 18:46 (ссылка)
COUNTIF или СЧЁТЕСЛИ если эксель русский:

Маша =COUNTIF(A:A;A1) =СЧЁТЕСЛИ(A:A;A1)
Коля =COUNTIF(A:A;A2) =СЧЁТЕСЛИ(A:A;A2)
Ли =COUNTIF(A:A;A3) =СЧЁТЕСЛИ(A:A;A3)
Маша =COUNTIF(A:A;A4) =СЧЁТЕСЛИ(A:A;A4)
Ли =COUNTIF(A:A;A5) =СЧЁТЕСЛИ(A:A;A5)
Ли =COUNTIF(A:A;A6) =СЧЁТЕСЛИ(A:A;A6)
Коля =COUNTIF(A:A;A7) =СЧЁТЕСЛИ(A:A;A7)
Маша =COUNTIF(A:A;A8) =СЧЁТЕСЛИ(A:A;A8)
Ли =COUNTIF(A:A;A9) =СЧЁТЕСЛИ(A:A;A9)

Потом сортировать по колонке с формулой.

(Ответить)


[info]lenta
2013-11-22 01:57 (ссылка)
Хотел было предложить загрузить в zoho и резвиться на просторе в полный рост... но у них на бесплатном аккаунте, оказывается, лимит в десять тысяч записей в одну таблицу, а у вас побольше будет, не полезет. Хотя, если разбить на куски (по годам, напр.), а потом сообразить, как обратно собрать, - может, и сработает...

(Ответить)


[info]lenta
2013-11-22 02:59 (ссылка)
...вот жмоты: лимит не на таблицу, а вообще на всю БД, так что и с разбитыми данными не светит.

(Ответить) (Ветвь дискуссии)


[info]r_l
2013-11-22 03:13 (ссылка)
См. вокруг.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]lenta
2013-11-22 03:22 (ссылка)
Да, я видел, что проблема решена, только это ведь решение временное. Завтра принесут еще кусок экселя, и все придется переделывать... А с базой данных было бы во всех отношениях получше, конечно.

Ну и, к тому же, вряд ли работать с локальными файлами правильнее, чем с удаленной БД.

То есть понятно, что это только сырые подготовительные материалы, но лучше бы сразу делать по уму.

(Ответить) (Уровень выше) (Ветвь дискуссии)


[info]r_l
2013-11-22 03:25 (ссылка)
Согласный.

(Ответить) (Уровень выше)


[info]moishasan
2013-11-22 11:23 (ссылка)
Ну да, перегнать в БД и там уже все что угодно.
Я, к сожалению, не знаком с бесплатными базами с удобным интерфейсом для обычного юзера.

(Ответить)


[info]lenta
2013-11-22 11:59 (ссылка)
Строго говоря, никто, конечно, не мешает поставить БД локально, дело нехитрое, а дамп потом можно по ходу дела перекинуть в какое-нибудь общедоступное место...

(Ответить)