Или небольшая заметка про странный глюк (на самом деле фичу) MS и кривофикс к ней.
Словил странный баг при поиске файлов по маске, функцией Directory.GetFiles();
Оказалось, что при задании маски вида *.htm
, в выборке окажутся все файлы с расширением, длина которого больше трех совпадающих символов, т.е. и *.htm
и *.html
и *.htmепрст
, и т.д. Срабатывает это для файлов с расширениями размером три символа и больше.
Т.е. на *.ph
оно найдет только файлы с расширением ph
, а на *.a
- только файлы с расширением a
Этот баг распространяется только на последнее расширение. Если в имени файла есть конструкция типа *.tmp.php
, например admin.tmp.php
, то при задании маски *.php
расширение tmp
будет, слава Ктулху, проигнорировано.
Оказалось, что это не баг, а фича, и об этом прямо написано в MSDN:
Если указанное расширение имеет длину ровно три символа, метод возвращает файлы с расширениями, которые начинаются с указанного расширения. Например, "*. xls" возвращает оба значения: "Book.xls" и "Book.xlsx".
Не знаю, как создатели DOS смогли заговнять и испортить самую простую операцию, которая работала у них, как минимум, с 1989 года, но факт. Заговняли.
В общем, я теряюсь в догадках.
Это, конечно же, довольно коряво. Наверное, можно было бы решить с помощью регулярных выражений, но я поступил следующим образом:
1. Создал функцию, которая будет вытаскивать однозначное расширение и из заданной маски, и из поданного на вход файла:
private string GetExtension(string FileName)
{
FileName = FileName.Replace('*', '_');
FileName = FileName.Replace('?', '-');
FileInfo fi = new FileInfo(FileName);
return fi.Extension;
}
Замены
Replace(...)
тут для того, чтобы класс FileInfo
не выпал в Exeption, если ему подать что-то вида *.html
, т.к. FileInfo
не принимает имен с недопустимыми символами, к которым относятся и маски подстановки. В определении расширений класс FileInfo
такого глюка не имеет, и отличает file.html
от file.htm
. И тоже не признает двойные расширения, учитывая только последнее.2. В функции, где будем вызывать поиск файлов, вызываем, собственно, функцию поиска:
string[] files = Directory.GetFiles(Path, Mask, SearchOptions);
3. Получаем расширение маски:
string MaskExt = GetExtension(Mask);
4. Далее обрабатываем выходной массив. Например, тут я добавлял его в
List<string>
с именем FoundFiles
. Мне надо было искать файлы по маскам, и нужно было, чтоб *.htm
и, например, *.html
различались.Например, я просто сравнивал расширение от маски файла с расширением от имени файла, и если оно совпадало - добавлял в результирующий список
FoundFiles
:string FileExt = GetExtension(filename);
if (FileExt == MaskExt)
{
FoundFiles.Add(filename);
}
Или относительно полностью:
string MaskExt = GetExtension(Mask);
//[...]
string[] files = Directory.GetFiles(Path, Mask, SearchOptions);
foreach (string filename in files)
{
string FileExt = GetExtension(filename);
if (FileExt == MaskExt)
{
FoundCtr++;
FoundFiles.Add(filename);
}
}
Это репост с сайта http://tolik-punkoff.com
Оригинал: http://tolik-punkoff.com/2020/01/02/c-po