没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
试读
25页
一切都始于一场赌注。2001 年,Jonah Peretti,那时还是麻省理工学院的研究生,拖延了他的毕业进程。他没有写论文,而是决定接受耐克公司提供的机会,打造一双个性化的运动鞋。根据当时推出的最新项目,任何人都可以在耐克的新网站——NIKEiD进行这样的设计。唯一的问题是,至少从耐克的角度来看,像Peretti所请求的那样,在耐克鞋上打出“血汗工厂”①的字眼,是不能予以考虑的。Peretti通过一系列发给耐克公司的电子邮件表示抗议,他指出“血汗工厂”一词并不属于该公司明令禁止条款中的任何类别,因此不应该导致他的请求被拒绝。。。。。。
资源推荐
资源详情
资源评论
预测你的内容是否会广为流传
一切都
始于一场赌注。2001 年,Jonah Peretti,那时还是麻省理工学院的研究生,拖延
了他的毕业进程。他没有写论文,而是决定接受耐克公司提供的机会,打造一双个性化的
运动鞋。根据当时推出的最新项目,任何人都可以在耐克的新网站——NIKEiD进行这样的
设计。唯一的问题是,至少从耐克的角度来看,像Peretti所请求的那样,在耐克鞋上打出“血
汗工厂”
①
但他究竟是怎么做的呢?Peretti 如何发明秘密公式,来创建像野火一般蔓延的内容?
的字眼,是不能予以考虑的。Peretti通过一系列发给耐克公司的电子邮件表示抗
议,他指出“血汗工厂”一词并不属于该公司明令禁止条款中的任何类别,因此不应该导
致他的请求被拒绝。
Peretti 发现他与耐克的客服代表之间来来回回的邮件非常有意思,而且觉得别人可能
也会感兴趣,所以将这些信转发给一些亲近的朋友。几天之内,电子邮件已经进入了全世
界的各种收件箱。主流的媒体,例如 Time、Salon、The Guardian,甚至 Today show 的节目
都谈论到了这个。Peretti 是整个病毒式传播的中心。
不久之后,开始讨论的问题变成这种事情是否可以复制。他的朋友,Cameron Marlow,
一直在准备写有关病毒式传播的博士论文,并且非常肯定这样的事情对于任何人来说都很
难刻意为之的。Marlow 和 Peretti 打赌,Peretti 不能重复耐克事件这样的成功。Peretti 迎接
了挑战。
一晃 15 年过去了,Jonah Peretti 领导着一个名为 BuzzFeed 的网站,它已经成为了病毒
式内容的同义词。2015 年该网站拥有超过 7700 万的独立访问者,在总触达率的排名中它
高于纽约时报。我认为 Peretti 赢得了这场赌注。
①译者注:耐克认为 Peretti 这样做是含沙射影地指向耐克工厂。
6.1 关于病毒性,研究告诉我们了些什么
139
在本章中,我们将试图解开其中一些奥秘。我们将观察一些广为流传的内容,并尝试找到
它们的共同点,看看它们和那些人们不太愿意分享的内容相比,到底有什么区别。
我们将在本章讨论以下主题。
•关于病毒性,研究告诉我们了些什么?
•获得被共享的内容和数量。
•探索可共享性的特征。
•构建预测性的内容评分模型。
6.1 关于病毒性,研究告诉我们了些什么
了解共享行为是一件很重要的事情。随着消费者对传统广告的日益麻木,推送应该不
再限于简单的触达,而是应该讲述更有吸引力的故事。这种尝试的成功在社交性分享中变
得越来越明显。为什么要花费力气做这些呢?因为对于一个品牌而言,每一次分享都意味
着触达了一个消费者——而且没有花费 1 分钱。
鉴于其价值,几个研究人员观察了分享行为,希望理解是什么激励人们这么去做。
研究人员发现了以下几点原因。
•为他人提供实用的价值(利他主义动机)。
•将自身和某些想法以及概念相关联(自我认同动机)。
•通过共同的情感与他人联系(公社动机)。
关于最后一个动机,一个经过特别精心设计的研究查看了 7,000 份来自《纽约时报》
的内容,以观察情感对分享行为的影响。他们发现,简单的情感和情绪不足以解释分享行
为,但当分享与情绪响应相结合时,解释力更大。例如,虽然悲伤具有很强的负面性,但
被认为是低响应状态。另一方面,愤怒既具有负面性,又具有相匹配的高响应状态。鉴于
此,使读者产生悲伤情绪的故事,其产生的进一步传播要比使读者产生愤怒情绪的故事产
生少得多,如图 6-1 所示。
这篇文章包含了动机方面的研究。然而,如果我们保持这些因素不变,其他属性将如
何影响某段内容的病毒式传播?其中一些因素可能包括:标题的语句、标题的长度、标题
的词性、内容的长度、发帖的社交网络、主题、主题的时间轴等等。毫无疑问,一个人可
以花费毕生的精力研究这种现象。然而,现在,我们只是花费接下来 30 页左右的内容进行
140
第 6 章预测你的内容是否会广为流传
相关研究。
图 6-1
6.2 获取分享的数量和内容
在开始探索哪些特征会使得内容易于共享之前,我们手头上需要足够的内容。我们还
需要每份内容在各种社交网络上的分享次数。幸运的是,获取这些并没有多大困难。我会
使用网站 ruzzit.com。
这是一个相对较新的网站——它仍处于beta测试阶段
①
①译者注:至少在原著作者撰写本书的时候是如此。
,但它会跟踪最常被分享的内容,
这正是我们需要的,如图 6-2 所示。
我们将从页面中抓取内容——不幸的是,没有可以直接使用的 API 接口。而且,因为
该网站使用了无限滚动的机制,我们需要使用第 3 章的老朋友,Selenium 和 PhantomJS。
现在开始抓取吧。
6.2 获取分享的数量和内容
141
图 6-2
我们将从最初需要导入的包开始。
import requests
import pandas as pd
import numpy as np
import json
import time
from selenium import webdriver
pd.set_option('display.max_colwidth', 200)
接下来,我们将设置Selenium浏览器。这里仅选择该站点过去一年的文章来生成URL
网址列表。需要设定浏览器的大小,以便获得标准的桌面外观,并且每隔 15 秒请求一次,
这事关礼仪
①
①译者注:频繁地爬取网站内容将对其服务器造成不必要的压力,作者认为这样做是不合礼仪的。
。我们也将向下滚动相当于 50 页的内容(每页有 10 篇文章)。
browser = webdriver.PhantomJS()
browser.set_window_size(1080,800)
browser.get("http://www.ruzzit.com/en-US/Timeline?media=Articles&timeline=
Year1&networks=All")
time.sleep(3)
pg_scroll_count = 50
while pg_scroll_count:
browser.execute_script("window.scrollTo(0, document.body.scrollHeight);")
time.sleep(15)
pg_scroll_count -= 1
titles = browser.find_elements_by_class_name("article_title")
142
第 6 章预测你的内容是否会广为流传
link_class = browser.find_elements_by_class_name("link_read_more_article")
stats = browser.find_elements_by_class_name("ruzzit_statistics_area")
在最后一节中,我们选择了分析所需的页面元素。接下来,需要进一步解析它们以获
取文本信息。
我在分析中去除 Twitter 所提供的分享次数。该公司在 2015 年年底决定从其标准 API
中删除此项数据。鉴于此,其展示的次数不太可靠。为了避免数据被污染的风险,最好直
接去除这些信息。
all_data = []
for title, link, stat in zip(titles, link_class, stats):
all_data.append((title.text,\
link.get_attribute("href"),\
stat.find_element_by_class_name("col-md-
12").text.split(' shares')[0],
stat.find_element_by_class_name("col-md-
12").text.split('tweets\n')
[1].split('likes\n0')[0],
stat.find_element_by_class_name("col-md-
12").text.split('1's\n')[1].split(' pins')[0],
stat.find_element_by_class_name("col-md-
12").text.split('pins\n')[1]))
接下来,我们将它放入一个数据框。
df = pd.DataFrame(all_data, columns=['title', 'link', 'fb', 'lnkdn',
'pins', 'date'])
df
上述代码生成图 6-3 的输出。
图 6-3
剩余24页未读,继续阅读
资源评论
好知识传播者
- 粉丝: 567
- 资源: 4204
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- ### 1、项目介绍 本项目Scrapy进行数据爬取,并使用Django框架+PyEcharts实现可视化大屏 效果如下:
- # 微信小程序-健康菜谱 基于微信小程序的一个查找检索菜谱的应用 ### 效果 !动态图(./res/gif/demo
- zabbix-get命令包资源
- 毕业设计,基于PyQt5实现的可视化界面的Python车牌自动识别系统源码
- 26-朴素贝叶斯分类.rar
- 没有安Matlab 也可以 生成FIR抽头系数工具.py
- python烟花代码.rar
- 实验目的: 1.构建基于verilog语言的组合逻辑电路和时序逻辑电路; 2.掌握verilog语言的电路设计技巧 3.完成如
- 扩展卡尔曼滤波matlab仿真
- 3_base.apk.1
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功