------------------------------------------------------------
 author: hjjdebug
 date:   2024年 08月 11日 星期日 16:35:31 CST
 description: 提取c语言的函数定义脚本
 ------------------------------------------------------------
  c 文件中包含很多函数定义, 我想在每个函数上设置断点.
  这需要首先知道所定义的函数名称.
  曾经想找一个能提取出c函数名的正则表达式, 网上找了一下,达不到要求.
  一个正则表达式是搞不定的.
  但我需要一个脚本, 不需要太精确,能大体搞定就可以了.
  所以我写了一个脚本,满足如下4个条件才可能是函数定义.
 1. 该行不能包含分号";"
     例如: int add(int x, int y);
     它只是一个函数声明而不是函数定义
  2. 该行必需有"("
     这很明显,没有"("肯定不是函数定义行
  3. 该行必需有")", 并且)到行尾之间不能有除白空格以外的其它东西
     例如: if((ret = open_input(filename)) < 0) 就不是函数定义
  4. "(" 前至少有2部分, 返回类型和函数名称
     例如: while (a > b) 就不是函数定义
     "(" 前只有一部分 while, 所以它不是一个函数
满足这4个条件仍然可能不是函数定义, 
 是的, 完美判断一个单词是否是函数定义需要词法分析和句法分析,太麻烦.
 经过这4个条件过滤,大体都是正确的了,满足了我的要求.
 当然如果不满足要求,你还可以再补充.
所以不要迷恋正则表达式,而应该迷恋编程,
艺术品是一刀一刀刻出来的,而不是一蹴而就的.
附: 我写的代码:
  
#!/bin/bash
if [ $# -lt 1 ]
thenecho "Usage $0 <filename>"echo "Usage $0 1.c"exit 1
fi
while read line 
doif [ "${line/;/}" != "${line}" ]; then  continue;  fi  #包含";" 继续if [ "${line/(/}" == "${line}" ]; then  continue;  fi  #不包含"(",继续#不包含")\s*$" 继续, 由于用到了正则,所以使用了grep命令,并把输出丢弃if ! echo $line |grep ")\s*$" >"/dev/null" ; then continue; fi #提取 “(" 前部分,由它继续过滤name0=$(echo $line | awk -F '(' '{print $1}')# 函数定义至少要2部分, 第1部分为返回类型,第2部分为函数名, 不满足者继续# 多于2部分是可能的, 例如第一部分是修饰词"static" "const" 等name=$(echo $name0 | awk -F' ' '{if(NF>=2) print $NF; else print ""}')if [ "$name" == "" ] ;then continue; fi # 这会去掉 "if","while"等语句echo $name
done < $1
 
