1、PAGE PAGE 10商务数据分析与应用期末试卷 参考答案(试卷往下看)一、填空题1程序或脚本;互联网搜索引擎2COUNT(value1,value2,.)3报表制作与发布4饼图;旭日图;瀑布图5标签化6关键词7时间跨度;设备终端8智钻;自动化9应用场景10按成交计费;商品推广代码;佣金二、单选题1C 2D 3C 4A 5B 6C 7D 8B 9A 10B三、多选题1ABD 2ACD 3ABC 4ABD 5BCD 6ABCD 7ACD8ABC 9AB 10ABD四、判断题1 2 3 4 5 6 7 89 10五、问答题1魔法数字(Magic Number)是留存分析的延伸,它与产品的核心功能
2、息息相关,并且已经得到了广泛重视。例如,首次注册微博会推荐关注10个“大V”,首次注册领英会推荐关注5个同事,很多社交产品规定每周签到5次,用户就可以获得双重积分或者虚拟货币,这里的“10个大V”“5个同事”“每周签到5次”就是魔法数字。2大数据技术被应用于各行各业,很多人通过爬虫来收集网页信息。下面列举一些典型的应用场景。(1)收集电商网站的商品数据用户利用爬虫软件可以对电商网站的商品数据(如品牌、价格、销量、规格、型号等)进行收集,然后分析该网站的畅销品牌、畅销品类、价格走势等,涵盖的信息量非常大。(2)爬取微博、BBS允许的数据用户利用爬虫软件可以针对某个主题从微博、论坛上爬取相关信息,
3、挖掘出关于该主题的一些有趣的信息。(3)爬取新闻用户利用爬虫软件可以爬取各大门户网站的新闻、各类电子报刊的新闻,例如,爬取百度新闻上关于某个关键字的信息,并于每周梳理出几个关键词,以抓住行业动向。(4)爬取学术信息用户利用爬虫软件可以爬取一些学术网站上的信息以学习研究,例如,在中国知网查询一个关键词“大数据”,就会出现很多与大数据相关的文献,点击进去就能看到每个文献的基本信息、文章摘要等。但若逐个点击查看会很耗费时间,这时可以写一个爬虫脚本,将这些数据按照规范的格式全部爬取下来,以后无论是阅读还是做进一步分析,都会方便很多。3(1)属性关键词:指介绍商品的类别、规格、产地、材质、功用、特点等基
4、本情况的字或词。(2)促销关键词:指关于清仓、折扣、甩卖、赠送礼物等信息的字或词。(3)品牌关键词:包括商品本身品牌或店铺品牌的字或词。(4)评价关键词:主要作用是使人产生一种心理暗示,一般都是正面、褒义的形容词。4智钻的扣费模式有两种CPM和按点击付费(Cost Per Click,CPC)。这两种扣费模式在进行展现时,都是按照千次展现出价进行排名的,排名靠前者优先展示。CPM按照每千次展现收费,点击不收费。按照竞价高低进行排名,价高者优先展现。例如,若出价100元,那么广告展现1000次收取100元,不满1000次系统会自动折算收费。CPC是按点击收费,即展现免费,点击才收费。在点击付费投
5、放模式下,将“点击出价”折算成“千次展现”的价格。折算后的CPM出价与其他卖家进行竞争,价格高的优先展示。六、分析题1提示:可以根据人口属性、兴趣标签、商业人口属性、消费意向等方面来分析。2提示:词根:面膜关键词:(1)属性关键词:泡沫、黑、免洗(2)品牌关键词:POLA、宝丽、BA直通车关键词质量分在相关性维度上的考虑要素可以从类目相关性、属性相关性、标题相关性等方面分析。3提示:从访客数、浏览量、支付金额、支付子订单数、支付买家数等方面分析。商务数据分析与应用期末试卷班级:_ 姓名:_一、填空题 (共10题,每空1分,共17分)1网络爬虫,是一种按照一定的规则自动抓取万维网信息的_,被广泛
6、应用于_或其他类似网站,可以自动采集所有其能够访问到的页面内容,以获取或更新这些网站的内容和检索方式。2COUNT函数的语法为_。3Power BI是一款BI工具,能够在较短的时间内生成各种炫酷的报表,其主要功能是_。4常见的反映比例关系的图表类型有_、_和_等。5用户画像是根据用户的社会属性、生活习惯及消费行为等信息而抽象出的一个_的用户模型。6_就是用户在使用搜索引擎时所输入的能够最大限度地概括其所要查找的信息内容的词语。7在进行搜索词查询时,只需事先设定_和_两个维度,然后输入要查询的关键词进行查询即可。82016年5月,钻石展位升级为_,实现了智能营销,其最大特征是_及高效。9卖家是不
7、是投放智钻,并不单纯地看类目和商品,其实更多的时候需要看在什么时候、用什么方法对智钻进行投放,这就是指智钻投放的_。10淘宝客推广是一种_的推广模式,淘宝客只要从淘宝客推广专区中获取_,当任何买家经过淘宝客的推广(可以是链接、个人网站、博客或者社区发的帖子等)进入淘宝卖家店铺并完成购买后,淘宝客就可以得到由卖家支付的_。二、单项选择题 (共10题,每题1分,共10分)1一手资料主要是经过自己直接收集整理以及从直接经验中所获得的资料。下列不属于一手资料的是( )。A用户访谈情况B用户的行为数据C研究报告D问卷调研情况2下列属于“脏数据”的是( )。 缺失数据 重复数据 错误数据AB、C、D全部3
8、下列属于网络爬虫的应用场景的是( )。 收集电商网站商品数据 爬取新闻 爬取微博数据 爬取私人信息A、B、C、D全部4常见的反映相关性的图表类型有( )。 散点图 热力图 柱形图 词云图A、B、C、D全部 5( )主要展现事物在各个维度上的分布情况,从而可以反映事物在什么方面强,在什么方面弱。A热力图B雷达图C柱形图D词云图6下列不属于生意参谋提供的数量指标的是( )。A访客数B卖家数C搜索点击率D收藏人数7在店铺流量来源中,( )是付费的。A购物车B淘宝搜索C淘宝频道D淘宝客8对于一般店铺而言,通过( )引入的流量是最大且免费的。A直通车B淘宝搜索C聚划算D类目查找9一个健康店铺的手淘首页和