在文件夹中,我们经常有类似s_1.txt、s_2.txt、s_10.txt、s_11.txt这样的命名方式,我们期望的排序方式是s_1.txt、s_2.txt、s_10.txt、s_11.txt(Vista & Windows7是这种方式),然而,按照常规的字符串排序算法的到的结果是s_1.txt、s_10.txt、s_11.txt、s_2.txt(Windows XP是这种方式)。
要实现方式1所需要的智能排序效果,我们的排序算法需要满足如下规则:
非数字部分按照字符串排序数字部分按照大小排序规则1的优先级高于规则2的优先级这个规则看起来简单,但是实现起来却不是那么容易,因为我们的文件名没有太大的约束,许多文件名时多段式字符串和数字混合在一起的,文件名之间也没有规律可循。由于今天写个小程序的时候需要这种功能,我在网上找了一下,没有什么合适的通用算法,便自己写了一个(实际上写了好几个,这个是最满意的一个)。
算法的原理很简单。
将字符串中的数字左侧填充0,变成定长的文件名。代码如下:
static Regex digitRegex = new Regex(@"\d+");
static string[] SmartSort(IEnumerable<string> files)
{
//这里只传文件名,以避免不必要的开销,不同的文件夹的文件没有智能排序的必要
var maxLength = files.Max(file => digitRegex.Matches(file).Cast<Match>().Max(num => num.Length));
var query = from file in files
let sortFile = digitRegex.Replace(file, m => m.Value.PadLeft(maxLength, '0'))
orderby sortFile
select file;
return query.ToArray();
}
static void Main(string[] args)
{
var files = Directory.GetFiles(@"R:\22").Select(i=>Path.GetFileName(i));
Console.WriteLine(string.Join("\r\n", SmartSort(files)));
}
这个算法可用于文件夹或同种类型的文件排序,对于不同的类型的文件的智能排序,还需要在linq查询的时候加上一个分组的功能,这里就懒得写了。
这个算法谈不上高效(这个算法只用来对一个文件夹下的所有文件排序,实际上也不存在什么效率问题),但却是我尝试的几种算法中最简单的一个,也是我最满意的一个,目前没有发现什么bug,如果谁有更合适的算法,欢迎指教。
到此这篇关于C#对文件名排序的文章就介绍到这了。希望对大家的学习有所帮助,也希望大家多多支持软件开发网。