Perl split字符串分割函数用法指南(perl 字符集)真没想到

随心笔谈9个月前更新 admin
229 00
🌐 经济型:买域名、轻量云服务器、用途:游戏 网站等 《腾讯云》特点:特价机便宜 适合初学者用 点我优惠购买
🚀 拓展型:买域名、轻量云服务器、用途:游戏 网站等 《阿里云》特点:中档服务器便宜 域名备案事多 点我优惠购买
🛡️ 稳定型:买域名、轻量云服务器、用途:游戏 网站等 《西部数码》 特点:比上两家略贵但是稳定性超好事也少 点我优惠购买

文章摘要

本文讨论了 Perl 中的 `split` 函数,该函数用于将字符串按指定的正则表达式分割并存储到数组中。默认情况下,`split` 函数会根据空格、冒号等分隔符将字符串分割成数组元素。例如,`split(/:/,$info)` 可以将字符串 `$info` 按冒号分割。 `split` 函数可以使用正则表达式来指定分隔符,例如 `split(/:+/, $_)` 可以将字符串按一个或多个空格分割。此外,未指定分隔符时,默认作用于 $_ 变量。需要注意的是,连续分隔符会导致分割结果中出现空字符串。 `split` 函数还支持 `LIMIT` 参数,用于限制分割后的域数量,减少内存使用和提高效率。例如,`split(/:t/, $_, 3)` 可以将字符串按冒号和换行符分割,并限制结果为 3 个域。使用 `LIMIT` 参数可以高效处理长字符串或大文件。 `split` 函数在处理字符、单词和段落分割方面非常灵活,支持多种分隔符组合。此外,`split` 函数还支持正则表达式,使其功能更加强大。例如,`split(/s+/,$line)` 可以将字符串按空格分割。 通过 `LIMIT` 参数,可以高效提取特定域,如 `split(/t/, $_, 6)` 可以提取前 6 个域。测试显示,使用适当 `LIMIT` 参数可以显著提高分割效率。 总之,`split` 函数是 Perl 中处理字符串分割的高效工具,支持多种分隔符和参数优化分割性能,适合处理复杂和大规模数据。



本文和大家重点讨论一下Perl split函数的用法,Perl中的一个非常有用的函数是Perl split函数-把字符串进行分割并把分割后的结果放入数组中。这个Perl split函数使用规则表达式(RE),如果未特定则工作在$_变量上。

Perl split函数

Perl中的一个非常有用的函数是Perl split函数-把字符串进行分割并把分割后的结果放入数组中。这个Perl split函数使用规则表达式(RE),如果未特定则工作在$_变量上。

Perl split函数可以这样使用: 

复制代码 代码如下:

$info=”Caine:Michael:Actor:14,LeafyDrive”; 

@personal=split(/:/,$info); 

其结果是:@personal=(“Caine”,”Michael”,”Actor”,”14,LeafyDrive”);

◆如果我们已经把信息存放在$_变量中,那么可以这样:

复制代码 代码如下:

@personal=split(/:/);

如果各个域被任何数量的冒号分隔,可以用RE代码进行分割: 

复制代码 代码如下:

$_=”Capes:Geoff::Shotputter:::BigAvenue”; 

@personal=split(/:+/); 

其结果是:@personal=(“Capes”,”Geoff”,”Shotputter”,”BigAvenue”);

但是下面的代码:

复制代码 代码如下:

$_=”Capes:Geoff::Shotputter:::BigAvenue”; 

@personal=split(/:/);

的结果是:@personal=(“Capes”,”Geoff”,””,”Shotputter”,””,””,”BigAvenue”);

◆这个Perl split函数中单词可以被分割成字符,句子可以被分割成单词,段落可以被分割成句子:

复制代码 代码如下:

@chars=split(//,$word);

@words=split(//,$sentence); 

@sentences=split(/\https://www.jb51.net/article/,$paragraph); 

在第一句中,空字符串在每个字符间匹配,所以@chars数组是一个字符的数组。>>

//之间的部分表示split用到的正则表达式(或者说分隔法则)

\s是一种通配符,代表空格

+代表重复一次或者一次以上。

所以,\s+代表一个或者一个以上的空格。

split(/\s+/,$line)表示把字符串$line,按空格为界分开。

比如说,$line=”你好朋友欢迎光临我的网站jb51.net”;

split(/\s+/,$line)后得到:

你好朋友欢迎访问我的网站jb51.net

一般用法: @somearray=split(/:+/, $string ); #括号可以不要。  若不指定$string, 则对默认变量$_操作, 两斜线间为分割符,可以用正则表达式,强悍异常。

在perl手册里,有一个用法不多见。即: split /PATTERN/, EXPR, LIMIT;  关键就是这个LIMIT参数,可以节省不少事情。 如果使用了LIMIT,且是正数,表示分割成不多于LIMIT指定的数目的域。If LIMIT is unspecified or zero, trailing null fields are stripped (which potential users of pop would do well to remember). If LIMIT is negative, it is treated as if an arbitrarily large LIMIT had been specified. Note that splitting an EXPR that evaluates to the empty string always returns the empty list, regardless of the LIMIT specified.

通过制定LIMIT,可以在很长(分割产生几万个元素or域)的行分割操作中,只返回关键的前几列的域值,减少了内存使用及时间消耗。比如一般的基因型数据,第一列通常是材料命名,需要通过材料名的判断取舍,这时候就可以这样用。 my ($firstfield)=split /\t/, $someline, 1;  如果需要前面几列的值,这样的方式对大文件效率很好: my (undef, $var1, undef, undef, undef, $var2)=split /\t/, $someline, 6;

有网友对这种方式做了测试,显示较好。引用如下:

>>>

一个文件,每行都有18项,各项之间用\t分割,使用时用到了第6项,折腾了几种用法

复制代码 代码如下:

my @array=split(“\t”,$_); my $var=$array[6];   测试文件平均用时8.2s

 my($var)=(split(“\t”,$_))[6];  测试平均用时5.1s

 my(undef,undef,undef,undef,undef,undef,$var)=split(“\t”,$_); 平均用时3.53s

 my(undef,undef,undef,undef,undef,undef,$var)=split(“\t”,$_,7);平均用时3.52s

 my $var=(split(“\t”,$_,7))[6]; 平均用时3.53s

看来后3种才是王道,如果需要使用多项也可以进行进行适当的变动。不过两项如果跨度比较大,3,4应该是不错选择,5就只能用中间数组。

自己动手测试下吧。

您可能感兴趣的文章:ASP中Split分割字符串函数的实例用法php字符串分割函数explode的实例代码js split 的用法和定义 js split分割字符串成数组的实例代码php+正则将字符串中的字母数字和中文分割

© 版权声明

相关文章