数据消失

Your go-to forum for bot dataset expertise.
Post Reply
zakiyatasnim
Posts: 331
Joined: Tue Jan 07, 2025 4:52 am

数据消失

Post by zakiyatasnim »

市面上有很多糟糕的信息图表。有些信息图表根本无法满足人类的感知,因此最终在数据上撒谎。有些信息图表则因为设计师试图做一些“不同”的事情而受到影响。但到目前为止,最大的问题之一是数据不完整。数据来源是造成这种情况的主要原因之一。处理大型数据集时,获取所有数据的成本非常高昂,无论是查找数据所需的人力还是支付调查研究公司的费用。为了削减成本,信息图表制作者和客户会想尽一切办法避免为这些数据付费。这就将他们限制在实际数据集摘要中的数据,以及他们可以从其他多个来源搜集到的其他数据。问题是,没有所有数据意味着你无法了解完整的故事。这会限制你可以使用的可视化效果,并给整个过程带来额外的压力。信息图表的连贯性将受到影响,它讲述的故事可能不完整,甚至完全错误。

不完整的数据也会导致一些相当奇怪的可视化效果。

设计师需要根据数据制作图像,当他们没有掌握所有数据时,他们只能用空白来填补。下面是一个损坏的可视化示例,其中缺失数据可能是罪魁祸首。 青少年在使用手机吗? 这是数据的双重编码吗?有时双重编码是好的,因为它强化了数据的维度。但在这种情况下,它不是双重编码。这里有几个问题,图表只会让它们更加混乱。 数据是累积的吗?包裹条形图(这 美国移动数据库 本来就不利于人类感知)表明数据是累积的,因为每个类别之间都有重叠,但饼图表明每个组都是独立的。如果数据是累积的,那么条形图可能会被解释为向后。每天发送 200 条短信的 11% 也是每天发送 100 条短信的群体的一部分,但条形图显示的是相反方向的包含。同时,每天发送 200 条短信的群体显然比每天发送 100 条短信的群体更具排他性,因此会更小。 是否存在部分与整体的关系?进入饼图的数据绝对需要具有部分与整体的关系,才能使饼图成为有效的可视化选择。根据数据/可视化的解释方式,情况可能如此,也可能不然。 有什么更好的方法吗?这种类型的数据可能最好用维恩图来表示,不幸的是,图表创建者可能没有足够的数据来表示所有的包含关系,所以他们最终得到了这种可怕的图表。从中吸取的教训是,拥有所有的数据很重要。获取数据可能很昂贵或耗时,但它肯定会改变最终产品的质量。设计可以让东西看起来很漂亮,但这与内容的质量无关。不要依赖设计师来弥补固有的数据问题。Drew Skau是UNCC的计算机科学可视化博士生,拥有建筑学学士学位。
Post Reply