toplogo
Inloggen

소셜 데이터 1년치로 살펴본 인사이트: "오늘 밤 블루스카이에 있어"


Belangrijkste concepten
온라인 소셜 공간의 오디스정보 확산이 증가하는 사회적 우려에도 불구하고, 최근 소셜 미디어 API 접근 제한으로 인해 공개적으로 이용 가능한 최신 소셜 미디어 데이터가 부족해지면서 계산사회과학의 발전이 저해되고 있다. 이 연구는 이러한 문제를 해결하기 위해 블루스카이 소셜 데이터 세트를 소개한다.
Samenvatting

이 연구는 블루스카이 소셜 데이터 세트를 소개한다. 블루스카이는 2023년 2월에 출시된 새로운 탈중앙화 온라인 소셜 플랫폼으로, 최근 개발자들에게 API를 공개하여 연구자들이 활용할 수 있는 데이터를 제공하고 있다.

이 데이터 세트에는 400만 명 이상의 사용자(전체 등록 사용자의 81%)와 2억 3500만 건의 게시물 내역이 포함되어 있다. 또한 팔로우, 댓글, 리포스트, 인용 등의 상호작용 데이터도 제공된다. 블루스카이는 사용자가 콘텐츠 추천 알고리즘인 피드 생성기를 만들고 북마크할 수 있는 기능을 제공하는데, 이 데이터 세트에는 이러한 피드 생성기의 출력과 해당 게시물에 대한 좋아요 정보도 포함되어 있다.

이 데이터 세트를 통해 온라인 행동과 인간-기계 상호작용 패턴에 대한 전례 없는 분석이 가능하다. 특히 콘텐츠 노출과 자기 선택의 영향, 콘텐츠 바이럴과 확산 분석 등을 수행할 수 있다.

데이터 수집 및 처리 과정에서는 사용자 익명성 보호를 위해 사용자 이름을 숫자 ID로 대체하고, 게시물 URI 등 개인 식별 정보를 제거하는 등의 조치를 취했다. 또한 게시물의 언어, 감정 분석 등 추가 처리를 수행했다.

데이터 분석 결과, 블루스카이 네트워크는 전형적인 소셜 네트워크 구조를 보이며, 게시물 상호작용 네트워크를 통해 콘텐츠 확산 패턴을 분석할 수 있다. 또한 피드 북마크 및 좋아요 데이터를 통해 주제별 관심사와 인기 콘텐츠를 파악할 수 있다. 특히 2023년 7월 중순 기간 동안 플랫폼 내 인종차별 논란이 있었음을 주제 모델링을 통해 확인할 수 있었다.

이 데이터 세트는 온라인 행동 및 인간-AI 상호작용 연구에 유용할 것으로 기대된다.

edit_icon

Samenvatting aanpassen

edit_icon

Herschrijven met AI

edit_icon

Citaten genereren

translate_icon

Bron vertalen

visual_icon

Mindmap genereren

visit_icon

Bron bekijken

Statistieken
전체 사용자 수는 약 400만 명으로, 이는 등록 사용자의 81%에 해당한다. 총 2억 3500만 건의 게시물이 수집되었다. 게시물 중 63백만 건(27%)은 리포스트이고, 12백만 건(5%)은 인용글이다. 수집된 게시물 중 영어 게시물 1억 2866만 건의 감정 분석을 수행했으며, 이 중 39%(5천만 건)는 긍정적, 27%(3천2백만 건)는 부정적, 41%(5천만 건)는 중립적인 것으로 나타났다.
Citaten
"온라인 소셜 공간의 오디스정보 확산이 증가하는 사회적 우려에도 불구하고, 최근 소셜 미디어 API 접근 제한으로 인해 공개적으로 이용 가능한 최신 소셜 미디어 데이터가 부족해지면서 계산사회과학의 발전이 저해되고 있다." "이 데이터 세트를 통해 온라인 행동과 인간-기계 상호작용 패턴에 대한 전례 없는 분석이 가능하다."

Belangrijkste Inzichten Gedestilleerd Uit

by Andrea Faill... om arxiv.org 05-01-2024

https://arxiv.org/pdf/2404.18984.pdf
"I'm in the Bluesky Tonight": Insights from a Year Worth of Social Data

Diepere vragen

블루스카이 사용자들이 선택한 피드 생성기 알고리즘이 의견 극화와 오디스정보 노출 위험을 어떻게 변화시키는지 살펴볼 수 있을까?

블루스카이 플랫폼은 사용자들이 커스텀 콘텐츠 추천 알고리즘인 피드 생성기를 선택하고 북마크할 수 있는 기능을 제공합니다. 이러한 기능을 통해 사용자들은 자신의 피드를 조정하고 다양한 콘텐츠를 필터링할 수 있습니다. 이러한 선택이 의견 극화와 오디스정보 노출 위험에 어떤 영향을 미치는지 분석할 수 있습니다. 먼저, 사용자가 특정 주제나 의견에 초점을 맞춘 피드 생성기를 선택하면 해당 주제나 의견에 노출될 가능성이 높아집니다. 이는 사용자들이 자신의 의견을 강화하거나 특정 의견에 노출되어 의견 극화를 촉진할 수 있습니다. 또한, 사용자가 특정 의견이나 정보에 노출되는 정도가 증가함에 따라 오디스정보 노출 위험이 증가할 수 있습니다. 이는 특정 의견이나 정보에 노출되는 사용자들이 해당 정보를 더 많이 공유하고 확산시킬 가능성을 높일 수 있습니다. 따라서, 블루스카이 데이터를 분석하여 사용자들이 선택한 피드 생성기 알고리즘이 의견 극화와 오디스정보 노출 위험에 미치는 영향을 조사하고 이를 통해 온라인 플랫폼 상의 의견 형성 및 정보 확산 패턴을 이해할 수 있습니다.

블루스카이 플랫폼 내 인종차별 논란에 대한 사용자들의 반응과 플랫폼 운영진의 대응은 어떠했는지 분석해볼 수 있을까?

블루스카이 플랫폼 내 인종차별 논란에 대한 사용자들의 반응과 플랫폼 운영진의 대응을 분석할 수 있습니다. 먼저, 사용자들의 반응은 플랫폼 내에서 어떤 대화가 이루어지고 있는지, 어떤 주제가 논의되고 있는지를 나타낼 수 있습니다. 특히, 인종차별과 관련된 논란에 대한 사용자들의 의견은 플랫폼 내 다양한 의견이 어떻게 충돌하고 상호작용하는지를 보여줄 수 있습니다. 또한, 플랫폼 운영진의 대응은 사용자들의 안전과 플랫폼의 이용 환경을 유지하는 데 중요한 역할을 합니다. 운영진이 어떻게 인종차별 논란에 대응했는지, 어떤 조치를 취했는지를 분석함으로써 플랫폼의 정책과 가치관을 이해할 수 있습니다. 또한, 운영진의 대응이 사용자들의 의견 형성과 플랫폼 내 다양성에 어떤 영향을 미쳤는지를 파악할 수 있습니다. 따라서, 블루스카이 데이터를 통해 인종차별 논란에 대한 사용자들의 반응과 플랫폼 운영진의 대응을 분석하여 온라인 커뮤니티 내 다양성과 안전을 증진시키는 방안을 모색할 수 있습니다.

블루스카이 데이터를 활용하여 온라인 커뮤니티 내 신뢰할 수 있는 정보원을 식별하고 이를 활용한 정보 확산 모델을 개발할 수 있을까?

블루스카이 데이터를 활용하여 온라인 커뮤니티 내 신뢰할 수 있는 정보원을 식별하고 이를 활용한 정보 확산 모델을 개발할 수 있습니다. 먼저, 데이터를 분석하여 어떤 사용자들이 신뢰할 만한 정보를 제공하고 있는지를 식별할 수 있습니다. 이를 위해 사용자들의 포스트 내용, 상호작용 패턴, 그리고 신뢰도 지표를 분석하여 정보 신뢰성을 평가할 수 있습니다. 다음으로, 이러한 정보원을 기반으로 정보 확산 모델을 개발할 수 있습니다. 이 모델은 사용자들이 신뢰할 만한 정보원으로부터 어떻게 정보를 수용하고 확산시키는지를 모델링할 수 있습니다. 또한, 정보 확산 모델을 통해 어떤 정보가 어떤 방식으로 확산되는지, 어떤 사용자들이 영향력을 행사하는지를 이해할 수 있습니다. 이를 통해 블루스카이 데이터를 활용하여 온라인 커뮤니티 내에서 신뢰할 수 있는 정보원을 식별하고 이를 활용한 정보 확산 모델을 개발함으로써 온라인 플랫폼 상의 정보 신뢰성을 높이고 사용자들에게 신뢰할 만한 정보를 제공할 수 있습니다.
0
star