博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
字符串、文件操作,英文词频统计预处理
阅读量:5883 次
发布时间:2019-06-19

本文共 684 字,大约阅读时间需要 2 分钟。

 

1.字符串操作:解析身份证号:生日、性别、出生地等。

     地址码: 表示编码对象常住户口所在县(市、旗、区)的行政区划代码。

  出生日期码:表示编码对象出生的年、月、日,年、月、日代码之间不用分隔符,格式为YYYYMMDD,如19880328。

  顺序码: 表示在同一地址码所标识的区域范围内,对同年、同月、同日出生的人编定的顺序号,顺序码的奇数分配给男性,偶数分配给女性。

  校验码: 根据本体码,通过采用ISO 7064:1983,MOD 11-2校验码系统计算出校验码。前面有提到数字校验码,我们知道校验码也有X的,实质上为罗马字符X,相当于10.

2.凯撒密码编码与解码

  凯撒加密法的替换方法是通过排列明文和密文字母表,密文字母表示通过将明文字母表向左或向右移动一个固定数目的位置。例如,当偏移量是左移3的时候(解密时的密钥就是3)

3.网址观察与批量生成

   比如学校官网的新闻模块,每一页都有相对应在html页面,比如第一页,网址就为:http://news.gzcc.cn/html/xiaoyuanxinwen/1.html 以此类推。可以直接使用for循环输出网址。

        for i in range(1,6):

        url='http://news.gzcc.cn/html/xiaoyuanxinwen/{}.html'.format(i)
        print(url)

 

英文词频统计预处理

  通过文件读取字符窜

 

读取文件

 

运行结果

 

词语统计

 

 

转载于:https://www.cnblogs.com/tysonnnn2/p/10471689.html

你可能感兴趣的文章
阿里云ECS的1M带宽能干嘛?
查看>>
在物联网时代如何打造安全的数据中心?
查看>>
评论:企业存储已经成为一潭死水
查看>>
安全威胁正推动对安全服务和事件响应支持的需求
查看>>
重新定义云数据库,中国数据库诞生40年即将迎来第三次变革
查看>>
解读数据中心生命周期管理五部曲
查看>>
Mellanox端到端InfiniBand网络助力欧洲超算中心
查看>>
《工业控制网络安全技术与实践》一2.3.1 可编程逻辑控制器
查看>>
用友优普携手秉钧网络打造完整闭环O2O方案
查看>>
展望网络安全未来 布局新兴信息技术
查看>>
《中国人工智能学会通讯》——11.71 在线多示例度量学习的结构化稀 疏表观模型...
查看>>
再谈多端适配
查看>>
选址攻略:数据中心选址要明了五大优势
查看>>
让计算变简单 | 信号高速路上,华为服务器是如何绕过那些“坑”的
查看>>
物联网快速发展 促进数据中心需要的爆炸性增长
查看>>
比自建 Hadoop 还便宜!云栖大会揭秘阿里云数加 MaxCompute
查看>>
《Web安全之机器学习入门》一 1.2 人工智能的发展
查看>>
谈3D打印技术在医疗行业的应用
查看>>
10 个最受欢迎的 Java 开发的 CMS 系统
查看>>
安全初创公司获百万风投资金的第一步:容器保护、人工智能和云安全
查看>>