当前位置:首页>编程日记>正文

如何在Linux上找到包含特定文本的所有文件?

我正在尝试找到一种方法来扫描整个Linux系统,查找包含特定文本字符串的所有文件。 只是为了澄清,我在文件中寻找文本,而不是文件名。

当我查找如何做到这一点时,我遇到了两次这个解决方案:

find / -type f -exec grep -H 'text-to-find-here' {} ;

但是,它不起作用。 它似乎显示系统中的每个文件。

这是否接近正确的方法呢? 如果没有,我该怎么办? 这种在文件中查找文本字符串的能力对于我正在做的一些编程项目非常有用。


#1楼

你可以使用grep -ilR

grep -Ril "text-to-find-here" /
  • i代表忽略大小写(在你的情况下是可选的)。
  • R代表递归。
  • l代表“显示文件名,而不是结果本身”。
  • /表示从机器的根目录开始。

#2楼

请执行下列操作:

grep -rnw '/path/to/somewhere/' -e 'pattern'
  • -r-R是递归的,
  • -n是行号,和
  • -w代表整个单词的匹配。
  • 可以添加-l (小写L)以仅提供匹配文件的文件名。

除此之外, - --exclude , - --include , - --exclude-dir标志可用于高效搜索:

  • 这只会搜索那些具有.c或.h扩展名的文件:

    grep --include=\*.{c,h} -rnw '/path/to/somewhere/' -e "pattern"

  • 这将排除搜索所有以.o扩展名结尾的文件:

    grep --exclude=*.o -rnw '/path/to/somewhere/' -e "pattern"

  • 对于目录,可以通过--exclude-dir参数排除特定目录。 例如,这将排除目录dir1 /,dir2 /以及所有匹配* .dst /:

     grep --exclude-dir={dir1,dir2,*.dst} -rnw '/path/to/somewhere/' -e "pattern" 

这对我来说非常有效,可以达到和你一样的目的。

有关更多选项,请查看man grep


#3楼

你可以使用ack 。 它就像grep的源代码。 您可以使用它扫描整个文件系统。

做就是了:

ack 'text-to-find-here'

在根目录中。

您还可以使用正则表达式 ,指定文件类型等。


UPDATE

我刚刚发现了The Silver Searcher ,它类似于ack但比它快3-5倍,甚至忽略了.gitignore文件中的模式。


#4楼

你可以用这个:

grep -inr "Text" folder/to/be/searched/

#5楼

包含给定文本的文件名列表

首先,我相信您使用了-H而不是-l 。 您也可以尝试在引号内添加文本,然后添加{} \

find / -type f -exec grep -l "text-to-find-here" {} ; 

假设您正在搜索目录中包含特定文本“Apache License”的文件。 它将显示与下面类似的结果(输出将根据您的目录内容而有所不同)。

bash-4.1$ find . -type f -exec grep -l "Apache License" {} ; 
./net/java/jvnet-parent/5/jvnet-parent-5.pom
./commons-cli/commons-cli/1.3.1/commons-cli-1.3.1.pom
./io/swagger/swagger-project/1.5.10/swagger-project-1.5.10.pom
./io/netty/netty-transport/4.1.7.Final/netty-transport-4.1.7.Final.pom
./commons-codec/commons-codec/1.9/commons-codec-1.9.pom
./commons-io/commons-io/2.4/commons-io-2.4.pom
bash-4.1$ 

区分大小写敏感度

即使您不使用“text”与“TEXT”之类的情况,也可以使用-i开关忽略大小写。 您可以在此处详细信息

希望这对你有所帮助。


#6楼

我写了一个Python脚本 ,它做了类似的事情。 这就是人们应该如何使用这个脚本。

./sniff.py path pattern_to_search [file_pattern]

第一个参数path是递归搜索的目录。 第二个参数pattern_to_search是我们想要在文件中搜索的正则表达式。 我们使用Python re库中定义的正则表达式格式。 在这个脚本中, . 也匹配换行。

第三个参数file_pattern是可选的。 这是另一个适用于文件名的正则表达式。 仅考虑与此正则表达式匹配的那些文件。

例如,如果我想搜索扩展名py包含Pool( Python文件Pool(后跟单词Adaptor ,我会执行以下操作,

./sniff.py . "Pool(.*?Adaptor"  .*py
./Demos/snippets/cubeMeshSigNeur.py:146 
./Demos/snippets/testSigNeur.py:259 
./python/moose/multiscale/core/mumbl.py:206 
./Demos/snippets/multiComptSigNeur.py:268 

瞧,它会生成匹配文件的路径和找到匹配项的行号。 如果找到多个匹配项,则每个行号将附加到文件名。


#7楼

要搜索字符串并使用搜索字符串输出该行:

for i in $(find /path/of/target/directory -type f); do grep -i "the string to look for" "$i"; done

例如:

for i in $(find /usr/share/applications -type f); 
do grep -i "web browser" "$i"; done

要显示包含搜索字符串的文件名:

for i in $(find /path/of/target/directory -type f); do if grep -i "the string to look for" "$i" > /dev/null; then echo "$i"; fi; done;

例如:

for i in $(find /usr/share/applications -type f); 
do if grep -i "web browser" "$i" > /dev/null; then echo "$i"; 
fi; done;

#8楼

以下是可用于搜索文件的几个命令列表。

grep "text string to search” directory-pathgrep [option] "text string to search” directory-pathgrep -r "text string to search” directory-pathgrep -r -H "text string to search” directory-pathegrep -R "word-1|word-2” directory-pathegrep -w -R "word-1|word-2” directory-path

#9楼

您可以使用:

grep -r "string to be searched"  /path/to/dir

r代表递归,因此将在指定的路径及其子目录中搜索。 这将告诉您文件名以及打印出字符串出现的文件中的行。

或者类似于您正在尝试的命令(例如:)用于搜索所有javascript文件(* .js):

find . -name '*.js' -exec grep -i 'string to search for' {} ; -print

这将打印出现文本的文件中的行,但不会打印文件名。

除了这个命令,我们也可以写这个: grep -rn“要搜索的字符串”/ path /到/ directory /或/ file -r:递归搜索 n:将显示匹配的行号


#10楼

即使我们没有找到字符串,也可以使用grep

只需跑步,

grep -RIl "" .

将打印出所有文本文件的路径,即仅包含可打印字符的文件。


#11楼

如果你的grep不支持递归搜索,你可以将findxargs结合使用:

find / -type f | xargs grep 'text-to-find-here'

我发现这比find -exec的格式更容易记住。

这将输出文件名和匹配行的内容,例如

/home/rob/file:text-to-find-here

您可能要添加到grep可选标志:

  • -i - 不区分大小写的搜索
  • -l - 仅输出找到匹配项的文件名
  • -h - 只输出匹配的行(不是文件名)

#12楼

find /path -type f -exec grep -l "string" {} ;

评论解释

find是一个命令,可以让您在给定路径的子目录中查找文件和其他对象,如目录和链接。 如果未指定文件名应满足的掩码,则枚举所有目录对象。

-type f specifies that it should proceed only files, not directories etc.
-exec grep specifies that for every found file, it should run grep command, passing its filename as an argument to it, by replacing {} with the filename

#13楼

尝试:

find . -name "*.txt" | xargs grep -i "text_pattern"

#14楼

试试这个:

find . | xargs grep 'word' -sl

#15楼

希望这有助于......

稍微扩展grep以在输出中提供更多信息,例如,获取文本所在文件中的行号可以按如下方式完成:

find . -type f -name "*.*" -print0 | xargs --null grep --with-filename --line-number --no-messages --color --ignore-case "searthtext"

如果你知道文件类型是什么,你可以通过指定要搜索的文件类型扩展来缩小搜索范围,在这种情况下.pas.dfm文件:

find . -type f ( -name "*.pas" -o -name "*.dfm" ) -print0 | xargs --null grep --with-filename --line-number --no-messages --color --ignore-case "searchtext"

选项的简短说明:

  1. .find指定当前目录。
  2. -name*.* ”:表示所有文件(-name“ *.pas ”-o -name“ *.dfm ”):只有*.pas OR *.dfm文件,或者用-o指定
  3. -type f指定您正在查找文件
  4. -print0--null上的另一边| (管道)是关键的,将文件名从find发送到嵌入在xargsgrep ,允许在文件名中传递带有空格的文件名,允许grep将路径和文件名视为一个字符串,而不是破坏它在每个空间。

#16楼

尝试:

find / -type f -exec grep -H 'text-to-find-here' {} ;

这将搜索所有文件系统,因为/是根文件夹。

对于主文件夹使用:

find ~/ -type f -exec grep -H 'text-to-find-here' {} ;

对于当前文件夹使用:

find ./ -type f -exec grep -H 'text-to-find-here' {} ;

#17楼

grep ( GNU或BSD )

您可以使用grep工具递归搜索当前文件夹,如:

grep -r "class foo" .

注意: -r - 递归搜索子目录。

您还可以使用通配语法在特定文件中进行搜索,例如:

grep "class foo" **/*.c

注意:通过使用globbing选项 ( ** ),它以递归方式扫描具有特定扩展名或模式的所有文件。要启用此语法,请运行: shopt -s globstar您也可以对所有文件使用**/*.* (隐藏和不扩展除外)或任何其他模式。

如果您的错误是您的参数太长,请考虑缩小搜索范围,或使用find语法,例如:

find . -name "*.php" -execdir grep -nH --color=auto foo {} ';'

或者使用ripgrep

ripgrep

如果你正在处理更大的项目或大文件,你应该使用ripgrep ,比如:

rg "class foo" .

查看GitHub项目页面上的文档,安装步骤或源代码。

它比任何其他工具(如GNU / BSD grepucgagsiftackpt或类似工具)快得多,因为它建立在Rust的正则表达式引擎之上,该引擎使用有限自动机,SIMD和积极的文字优化来快速搜索。

它支持忽略.gitignore文件中指定的模式,因此可以同时将单个文件路径与多个glob模式进行匹配。


您可以使用常用参数,例如:

  • -i - 不敏感的搜索。
  • -I - 忽略二进制文件。
  • -w - 搜索整个单词(与部分单词匹配相反)。
  • -n - 显示您的匹配项。
  • -C / --context (如-C5 ) -增加背景下,让你看到周围的代码。
  • --color=auto - 标记匹配的文本。
  • -H - 显示找到文本的文件名。
  • -c - 显示匹配行的数量。 可与-H组合使用。

#18楼

如何在Linux上找到包含特定文本的所有文件? (......)

我两次遇到这个解决方案:

find / -type f -exec grep -H 'text-to-find-here' {} \;


如果使用发现就像在你的榜样,最好加-s--no-messages ),以grep ,和2>/dev/null在命令结束,以避免大量的权限否认发出的消息grepfind

find / -type f -exec grep -sH 'text-to-find-here' {} ; 2>/dev/null

find是在类Unix平台上搜索文件的标准工具 - 在查找特定文本时与grep结合使用。 顺便说一句, find命令通常与xargs结合使用。

为同一目的存在更快更容易的工具 - 见下文。 如果它们在您的平台上可用,请更好地尝试它们,当然:

更快更容易的替代品

RipGrep - 最快的搜索工具:

rg 'text-to-find-here' / -l

银色搜索者

ag 'text-to-find-here' / -l

确认

ack 'text-to-find-here' / -l

注意:您也可以向这些命令添加2>/dev/null ,以隐藏许多错误消息。


警告除非你真的无法避免它,否则不要在'/' (根目录)中搜索以避免长时间和低效的搜索! 因此,在上面的示例中,您最好用子目录名替换' / ',例如“/ home”取决于您实际想要搜索的位置...


#19楼

以下命令适用于此方法:

find ./ -name "file_pattern_name"  -exec grep -r "pattern" {} ;

#20楼

grep -insr "pattern" *
  • i :忽略PATTERN和输入文件中的大小写区别。
  • n :在输入文件中使用从1开始的行号为每行输出添加前缀。
  • s :禁止有关不存在或不可读文件的错误消息。
  • r :递归读取每个目录下的所有文件。

#21楼

避免麻烦并安装ack-grep。 它消除了许多许可和报价问题。

apt-get install ack-grep

然后转到要搜索的目录并运行以下命令

cd /
ack-grep "find my keyword"

#22楼

使用pwd从您所在的任何目录中搜索,向下递归

grep -rnw `pwd` -e "pattern"

更新根据您使用的grep版本,您可以省略pwd 。 在较新的版本上. 如果没有给出目录,似乎是grep的默认情况:

grep -rnw -e "pattern"

要么

grep -rnw "pattern"

会做同上面的事情!


#23楼

有一个ack工具可以完全满足您的需求。

http://linux.die.net/man/1/ack

ack -i search_string folder_path/*

您可以忽略-i用于区分大小写的搜索


#24楼

有一个名为The Silversearcher的新工具

sudo apt install silversearcher-ag

它与Git和其他VCS密切合作。 所以你不会在.git或其他目录中获得任何东西。

你可以简单地使用

ag "Search query"

它会为你完成任务!


#25楼

Silver Searcher是一个了不起的工具,但ripgrep可能会更好。

它可以在Linux,Mac和Windows上运行,并且在几个月前写在Hacker News上 (这有一个链接到Andrew Gallant的Blog,它有一个GitHub链接):

Ripgrep - 一种新的命令行搜索工具


#26楼

使用:

grep -c Your_Pattern *

这将报告当前目录中每个文件中有多少个模式副本。


#27楼

一个简单的find可以很方便。 在~/.bashrc文件中将其别名:

alias ffind find / -type f | xargs grep

启动新终端并发出:

ffind 'text-to-find-here'

#28楼

所有以前的答案都建议grep并找到。 但还有另一种方法:使用午夜指挥官

它是一个免费的实用程序(30岁,经过时间证明),它是视觉上没有GUI。 它有很多功能,查找文件只是其中之一。


#29楼

我很着迷于grep用'rl'做出的简单方法

grep -rl 'pattern_to_find' /path/where/to/find-r to find recursively file / directory inside directories..
-l to list files matching the 'pattern'

使用'-r'而不是'l'来查看文件名后面跟着找到模式文本

grep -r 'pattern_to_find' /path/where/to/find

工作得很完美..

希望能帮助到你!


#30楼

grep是你实现这一目标的好朋友。

grep -r <text_fo_find> <directory>

如果你不关心文本的情况下找到然后使用

grep -ir <text_to_find> <directory>

http://www.coolblog.cn/news/9927fcdc1ed55477.html

相关文章:

  • asp多表查询并显示_SpringBoot系列(五):SpringBoot整合Mybatis实现多表关联查询
  • s7day2学习记录
  • 【求锤得锤的故事】Redis锁从面试连环炮聊到神仙打架。
  • 矿Spring入门Demo
  • 拼音怎么写_老师:不会写的字用圈代替,看到孩子试卷,网友:人才
  • Linux 实时流量监测(iptraf中文图解)
  • Win10 + Python + GPU版MXNet + VS2015 + RTools + R配置
  • 美颜
  • shell访问php文件夹,Shell获取某目录下所有文件夹的名称
  • 如何优雅的实现 Spring Boot 接口参数加密解密?
  • LeCun亲授的深度学习入门课:从飞行器的发明到卷积神经网络
  • Mac原生Terminal快速登录ssh
  • 支撑微博千亿调用的轻量级RPC框架:Motan
  • java受保护的数据与_Javascript类定义语法,私有成员、受保护成员、静态成员等介绍...
  • mysql commit 机制_1024MySQL事物提交机制
  • 法拉利虚拟学院2010 服务器,法拉利虚拟学院2010
  • 2019-9
  • jquery 使用小技巧
  • vscode pylint 错误_将实际未错误的py库添加到pylint白名单
  • 科学计算工具NumPy(3):ndarray的元素处理
  • 工程师在工作电脑存 64G 不雅文件,被公司开除后索赔 41 万,结果…
  • linux批量创建用户和密码
  • js常用阻止冒泡事件
  • newinsets用法java_Java XYPlot.setInsets方法代碼示例
  • 气泡图在开源监控工具中的应用效果
  • 各类型土地利用图例_划重点!国土空间总体规划——土地利用
  • php 启动服务器监听
  • dubbo简单示例
  • [iptables]Redhat 7.2下使用iptables实现NAT
  • Ubuntu13.10:[3]如何开启SSH SERVER服务
  • 【设计模式】 模式PK:策略模式VS状态模式
  • JS实现-页面数据无限加载
  • CSS小技巧——CSS滚动条美化
  • 最新DOS大全
  • Django View(视图系统)
  • 阿里巴巴分布式服务框架 Dubbo
  • 阿里大鱼.net core 发送短信
  • 程序员入错行怎么办?
  • Sorenson Capital:值得投资的 5 种 AI 技术
  • 两张超级大表join优化
  • Arm芯片的新革命在缓缓上演
  • 第九天函数
  • Linux软件安装-----apache安装
  • HDU 5988 最小费用流
  • 《看透springmvc源码分析与实践》读书笔记一
  • 正式开课!如何学习相机模型与标定?(单目+双目+鱼眼+深度相机)
  • nagios自写插件—check_file
  • python3 错误 Max retries exceeded with url 解决方法
  • 通过Spark进行ALS离线和Stream实时推荐
  • 行为模式之Template Method模式