51Testing软件测试论坛

标题: shell 脚本问题求指教 [打印本页]

作者: 芭比哇玩123    时间: 2017-6-9 13:42
标题: shell 脚本问题求指教
背景
本想每天刷一道leetcode,保持学习,但第一道就被困住了
题目如下
  1. Given a text file file.txt that contains list of phone numbers (one per line), write a one liner bash script to print all valid phone numbers.

  2. You may assume that a valid phone number must appear in one of the following two formats: (xxx) xxx-xxxx or xxx-xxx-xxxx. (x means a digit)

  3. You may also assume each line in the text file must not contain leading or trailing white spaces.

  4. For example, assume that file.txt has the following content:

  5. 987-123-4567
  6. 123 456 7890
  7. (123) 456-7890
  8. Your script should output the following valid phone numbers:
  9. 987-123-4567
  10. (123) 456-7890
复制代码
我的解法
  1. #!/bin/bash
  2. pattern1="^[0-9]{3}-[0-9]{3}-[0-9]{4}$"
  3. pattern2="^\([0-9]{3}\) [0-9]{3}-[0-9]{4}$"

  4. cat ./file.txt | while read line
  5. do
  6. #echo "ori=$line"
  7.         if [[ $line =~ $pattern1 ]] || [[ $line =~ $pattern2 ]] ; then
  8.                 echo $line
  9.         fi
  10. done
复制代码
结果是一个都没匹配出来查找问题的时候,尝试改成
  1. #!/bin/bash
  2. pattern1="^[0-9]{3}-[0-9]{3}-[0-9]{4}$"
  3. pattern2="^\([0-9]{3}\)\s[1][0-9]{3}-[0-9]{4}$"

  4. cat ./file.txt | while read line
  5. do

  6. echo "ori=$line"
  7.         if [[ $line =~ ^[0-9]{3}-[0-9]{3}-[0-9]{4}$ ]] || [[ $line =~ ^\([0-9]{3}\)' '[0-9]{3}-[0-9]{4}$ ]] ; then
  8.                 echo $line
  9.         fi
  10. done
复制代码
输出符合期望,如果在正则表达式附近加上双引号,则一个都匹配不出来,便以为表达式不可以用字符串的形式,于是修改脚本为
  1. #!/bin/bash
  2. pattern1=^[0-9]{3}-[0-9]{3}-[0-9]{4}$
  3. pattern2=^\([0-9]{3}\)' '[0-9]{3}-[0-9]{4}$

  4. cat ./file.txt | while read line
  5. do

  6. echo "ori=$line"
  7.         if [[ $line =~ ${pattern1} ]] || [[ $line =~ ${pattern2} ]] ; then
  8.                 echo $line
  9.         fi
  10. done
复制代码

发现只有第一个正则表达式work了,第二个依然没有匹配出来
那么如果我想用变量的方式让第二个正则表达式work,该怎么修改?




作者: 测试就是来开荒    时间: 2017-6-9 14:47
给出一种方案:
awk '/\[0-9]{3}) |[0-9]{3}-)[0-9]{3}-[0-9]{4}$/ {print $0}' file.txt

建议把不符合的输入内容也提供出来,方便使用你的代码调试。
作者: 测试的味道    时间: 2017-6-9 14:48
话题中一共给了3个方法,经在leetcode.com网站上验证和测试,
方法1可行;
方法2注释掉echo "ori=$line"后也可行;
方法3:可以用引号括起来,但空格两边的单引号需要去掉。
  1. #!/bin/bash
  2. pattern1="^[0-9]{3}-[0-9]{3}-[0-9]{4}$"
  3. pattern2="^\([0-9]{3}\) [0-9]{3}-[0-9]{4}$"

  4. cat ./file.txt | while read line
  5. do

  6. # echo "ori=$line"
  7.         if [[ $line =~ ${pattern1} ]] || [[ $line =~ ${pattern2} ]] ; then
  8.                 echo $line
  9.         fi
  10. done
复制代码

作者: 小爸爸    时间: 2017-6-9 14:49
楼上正解, 方法2 echo "ori=$line" 是否注释似乎不影响吧。
作者: 测试的味道    时间: 2017-6-9 14:50
小爸爸 发表于 2017-6-9 14:49
楼上正解, 方法2 echo "ori=$line" 是否注释似乎不影响吧。

对于完成一个具体的工作来说,echo是一条调试信息。但对于这个题来说,echo就影响了最终的结果,没有必要打印无关的内容。
作者: 小皮球的故事    时间: 2017-6-9 14:51
我之前用方法一在本地调试一直过不了,所以后来才会把表达式改的这么诡异,相同的输入用方法二就可以过,所以没有怀疑环境本身;刚用leetcode试了一下方法一,确实过了,看来我给在本地找找原因了,3Q~




欢迎光临 51Testing软件测试论坛 (http://bbs.51testing.com/) Powered by Discuz! X3.2