2022
被拐的她们:1252段被标价的人生 1252 abducted women:their trafficked life
Country/area: China
Organisation: RUC news studio
Organisation size: Big
Publication date: 08/01/2021

Credit: 张瑞,江婧怡,姜乃菲,杨楚楚,方洁
Biography:
在创作时,我们是新闻传播专业大三在读学生,这一作品实际上是我们的课程实践,但我们希望专业地完成它,包括选题和制作。我们一直都十分关注中国女性的生活现状,并渴望将她们的遭遇真实呈现,尽我们最大的努力推动对妇女权益保护事业的关注。这是我们创作该数据新闻的初衷。我们并没有太多制作经验,完成作品的过程也是学习和进步的过程。在制作中,我们现学了数据处理和可视化的技术,希望能够和全球的数据新闻记者进行交流,共同进步。
Project description:
通过查阅2017年1月1日《关于审理拐卖妇女儿童犯罪案件具体应用法律若干问题的解释》生效后关于拐卖妇女的裁判文书,选取聚法案例和中国裁判文书网两个裁判文书集中检索平台作为数据来源,以 “拐卖妇女”作为检索案由,共得到涉及拐卖妇女的有效裁判文书616份。从每份文书中提取出被告人、受害人、收买者的人员特征信息和相互关系,以及拐卖地点、过程等信息;同时结合相关法律的变化和微博评论等,作为本文的数据基础,从受害者的角度呈现妇女被拐现状、法律给予的保护和舆论观点。
Impact reached:
拐卖妇女这种产生已久,而今天依然存在的犯罪行为,给被拐妇女及其家庭带来了巨大的灾难和伤害,同时也严重危害了社会安定。我们希望从数据的角度解构拐卖妇女的相关案件,刻画被拐妇女形象,阐述他们的普遍经历,思考拐卖妇女屡禁不止的原因,并调查大众对于这一犯罪的看法,希望能为相关法律的修正提供见解。
Techniques/technologies used:
在数据分析上,我们使用excel中的数据透视表等功能统计每个维度的数据数量和比例等,对每个数据维度加以描述。还使用python对微博广场上的相关评论进行爬取,做成舆论意见的词云图。使用python对文书中全部的妇女自述进行情感分析。
What was the hardest part of this project?
1.手动对616篇法律文书进行分维度梳理工程量很大。
要将其中的时间、地点、各种具体情节分别对应每一名妇女拆分出来填入表格中。有的文书中涉及十几名妇女,中国的妇女名字是极其相近的“X某”,而外国妇女则是一长串念不通的英文,但必须区分人名及对应遭遇(犯罪分子和其他证人等相关人物的名字也混杂其中)。不少文书人物关系复杂、妇女经历了多次转卖,需要首先理清楚其中混乱的人物关系。
2. 相比于犯罪分子,出于保护受害人隐私和案件判决需要等客观因素,有可利用的受害人信息的文书很少,即便有提及内容也很少,因此需要翻阅更多的文书来保证数据的充足。
同时,受害者的信息并非规定在开头或是其他相对固定的地方提到,而是散布于法律文书各部分内容之中。在记录模糊的文书中,需要在上下文间反复比对,综合妇女自述、证人证言、罪犯供述才能拼凑出情节。
What can others learn from this project?
我们团队大胆进行可视化创新。图中妇女自述图为原创图表,采用被束缚的妇女形象,创意性展现了妇女本人的自述,表露了妇女的真实情感和经历,让读者能够更加靠近这一群体,同时不影响新闻作品真实客观的立场要求。