当前位置:首页>编程日记>正文

python控件词语_python文件中的词

本站寻求有缘人接手,详细了解请联系站长QQ1493399855

展开全部

本文实例讲述了Python3处理文件中每个词的方法。分享给62616964757a686964616fe59b9ee7ad9431333363373835大家供大家参考。具体实现方法如下:Created on Dec 21, 2012

处理文件中的每个词

@author: liury_lab

'''

import codecs

the_file = codecs.open('d:/text.txt', 'rU', 'UTF-8')

for line in the_file:

for word in line.split():

print(word, end = "|")

the_file.close()

# 若词的定义有变,可使用正则表达式

# 如词被定义为数字字母,连字符或单引号构成的序列

import re

print()

print('************************************************************************')

re_word = re.compile('[w'-]+')

for word in re_word.finditer(line):

print(word.group(0), end = "|")

# 封装成迭代器

def words_of_file(file_path, line_to_words = str.split):

for word in line_to_words(line):

yield word

for word in words_of_file('d:/text.txt'):

print(word, end = '|')

def words_by_re(file_path, repattern = '[w'-]+'):

def line_to_words(line):

for mo in re_word.finditer(line):

yield mo.group(0) # 原书为return,发现结果不对,改为yield

return words_of_file(file_path, line_to_words)

for word in words_by_re('d:/text.txt'):

希望能帮到你!


http://www.coolblog.cn/news/54e9678e09e9db34.html

相关文章:

  • asp多表查询并显示_SpringBoot系列(五):SpringBoot整合Mybatis实现多表关联查询
  • s7day2学习记录
  • 【求锤得锤的故事】Redis锁从面试连环炮聊到神仙打架。
  • 矿Spring入门Demo
  • 拼音怎么写_老师:不会写的字用圈代替,看到孩子试卷,网友:人才
  • Linux 实时流量监测(iptraf中文图解)
  • Win10 + Python + GPU版MXNet + VS2015 + RTools + R配置
  • 美颜
  • shell访问php文件夹,Shell获取某目录下所有文件夹的名称
  • 如何优雅的实现 Spring Boot 接口参数加密解密?
  • LeCun亲授的深度学习入门课:从飞行器的发明到卷积神经网络
  • 支撑微博千亿调用的轻量级RPC框架:Motan
  • Mac原生Terminal快速登录ssh
  • 法拉利虚拟学院2010 服务器,法拉利虚拟学院2010
  • java受保护的数据与_Javascript类定义语法,私有成员、受保护成员、静态成员等介绍...
  • mysql commit 机制_1024MySQL事物提交机制
  • 2019-9
  • jquery 使用小技巧
  • 科学计算工具NumPy(3):ndarray的元素处理
  • vscode pylint 错误_将实际未错误的py库添加到pylint白名单
  • linux批量创建用户和密码
  • 工程师在工作电脑存 64G 不雅文件,被公司开除后索赔 41 万,结果…
  • js常用阻止冒泡事件
  • newinsets用法java_Java XYPlot.setInsets方法代碼示例
  • 气泡图在开源监控工具中的应用效果
  • 各类型土地利用图例_划重点!国土空间总体规划——土地利用
  • php 启动服务器监听
  • dubbo简单示例
  • Ubuntu13.10:[3]如何开启SSH SERVER服务
  • [iptables]Redhat 7.2下使用iptables实现NAT
  • 【设计模式】 模式PK:策略模式VS状态模式
  • CSS小技巧——CSS滚动条美化
  • JS实现-页面数据无限加载
  • 最新DOS大全
  • Django View(视图系统)
  • 阿里巴巴分布式服务框架 Dubbo
  • 阿里大鱼.net core 发送短信
  • Sorenson Capital:值得投资的 5 种 AI 技术
  • 程序员入错行怎么办?
  • 两张超级大表join优化
  • Arm芯片的新革命在缓缓上演
  • 第九天函数
  • Linux软件安装-----apache安装
  • HDU 5988 最小费用流
  • 《看透springmvc源码分析与实践》读书笔记一
  • nagios自写插件—check_file
  • python3 错误 Max retries exceeded with url 解决方法
  • 正式开课!如何学习相机模型与标定?(单目+双目+鱼眼+深度相机)
  • 通过Spark进行ALS离线和Stream实时推荐
  • 行为模式之Template Method模式