百科生活 投稿
关于【提取文本中的数字】,Excel,今天小编给您分享一下,如果对您有所帮助别忘了关注本站哦。
- 内容导航:
- 1、【数港小科普】小港今天来给大家讲讲什么是数据获取!
- 2、提取文本中的数字:Excel 提取文本中数字公式
1、【数港小科普】小港今天来给大家讲讲什么是数据获取!
数港小科普
大数据
在信息时代,人们日常生产和活动都会产生各种各样的数据。从不同的数据源获取数据是数据处理的重要环节之一。
我们前面介绍了各种大数据支撑技术
大数据支撑技术之机器学习
大数据支撑技术之数据可视化
今天我们来讲
什么是数据获取?
数据获取的来源
根据数据产生的方式,原始数据主要包括以下几种类别:
1.企业交易数据
支撑企业单位业务运行的信息管理系统每天都会产生大量的数据,包括公司的生产数据、库存数据、订单数据;电子商务数据、互联网访问数据;银行账户交易数据、POS机数据、信用卡刷卡数据等等。这些数据通常是保存在服务器上数据库系统中,一般为结构化数据,适合于进行商业智能数据分析和处理。
2.用户行为数据
在互联网时代,人们日常活动也会产生大量的数据,包括电子邮件、文档、图片、音频、视频,以及通过微信、博客、推特、维基、脸书、Linkedin等社交媒体产生的数据。这些数据大多数为非结构性数据,需要用文本分析功能进行分析。
3.传感器数据
各种智能设备的传感器、量表也会产生大量的数据,例如智能电表、智能家电可连接互联网产生数据。物联网(IoT,Internet of Things)中的智能设备大多安装有传感器,会产生海量数据。分析处理来自传感器的数据,可以用于构建分析模型,实现连续监测预测性行为,提供有效的干预指令等。
4.观察统计数据
通过观察记录、调查统计也会产生大量数据,例如天气记录数据、世界银行有关各国指标的统计数据等等。这些数据一般以数据集或网页的形式存在,可直接在官网下载数据集进行分析处理,也可以通过网络爬虫爬取网页信息,然后进行分析处理。
数据获取的方法
根据数据的不同来源,有不同的数据获取方法。
1
直接使用企业内部数据或通过ETL抽取整合数据
对企业内部产生的数据,通常可以数据库接口(API)直接使用,或通过ETL抽取转换装载后使用。ETL是数据的抽取(Extract)、转换(Transform)和装载(Load)的英文简称。其目的是使企业内部的不同数据进行整合,从而进行更深入的处理和分析。
2
下载或购买数据集
除了企业内部拥有的数据,互联网上有海量的数据集。其中一些是公开免费的,允许直接下载使用。还有一些专业的信息公司会提供价值极高的数据集,可以购买使用。
3
通过网络爬虫抓取网页数据
在万维网(WWW)上,成千上万的网站上存在数以亿计的网页,其中包含了应有尽有的数据。在法律许可情况下,可以通过网络爬虫,爬取需要的数据,并分析处理。
4
通过API接口获取网页数据
网络API接口是网站或应用程序提供的信息交互和获取接口,例如腾讯微信、百度地图、百度音乐等都提供API接口。通过这些接口可以获取各种信息,例如城市天气信息、地图信息等等。
数据源和数据集
数据源与数据提取和存储相关。数据源可以是任何东西,从简单的文本文件到大型数据库。
数据集是数据的集合,通常以表格形式呈现。每一列代表一个特定的属性,每一行对应一个给定的数据成员。数据集表示数据源的逻辑实现。
参考文献:《数据分析与大数据实践》
天津数港
数据驱动智能,创新引领未来
编辑:潘玥 李向飞
审核:邓晶龙
2、提取文本中的数字:Excel 提取文本中数字公式
在Excel的操作中,有时需要对某个单元格中的文字进行提取数字部分。那要怎样操作呢?下面就来看看方法吧。
工具/材料
Excel2007
操作方法
首先,如图在C1单元格中输入公式=--LEFT(B1,LEN(B1)*2-LENB(B1)),获取B1中的数字12345。公式中“--”用来强制转换为数字格式,LEN获取格中文本长度,不管中文数字一律算为1个字符长度,而中文是2个字符长度,所以乘以2,再减掉实际长度LENB(B1),得到数字长度。LEFT为从左边开始获取。
上面是提取中文前的数字,接下来提取中文后面的数字。那么跟上面的一样操作,只需要把从左侧提取的LEFT函数替换成从右提取的函数RIGHT就可以了,如图函数=--RIGHT(B3,LEN(B3)*2-LENB(B3))
如果要自动判断前面是数字还是中文再进行提取,就需要用IF进行判断如图中公式“=IF(ISNUMBER(--LEFT(B3,1)),--LEFT(B3,LEN(B3)*2-LENB(B3)),--RIGHT(B3,LEN(B3)*2-LENB(B3)))”,ISNUMBER(--LEFT(B3,1))为检测获取的第一个字符是否为数字,是的话使用第一步中的公式,不是的话使用第二步中的公式。
如果要提取特殊字符中的数字,可以使用MID函数指从哪个位置开始进行获取,再用Find函数查找截止的特殊字符。如图=MID(B4,2,FIND("^",B4,1)-2),则为从B4格中第二个字符开始,截止到找到的^字符进行获取。
本文关键词:excel,excel表格制作教程入门,excel冻结特定行列,excel怎么筛选重复的内容,excel删除重复项。这就是关于《提取文本中的数字,Excel(小港今天来给大家讲讲什么是数据获取)》的所有内容,希望对您能有所帮助!
- 最近发表