<div dir="ltr"><div dir="ltr">Thanks Tingting,</div><div dir="ltr"><br></div><div>Your email is about data consistency in another location, not necessarily about Singapore data - so I started another email thread. </div><div><br></div><div>Just to clarify to the readers, you found 2 data sources with different numbers.</div><div><br></div><div>Let us examine the issue here and I have a few questions:</div><div><br></div><div>1. Were those different infections / hospitalizations numbers? </div><div><br></div><div>2. Can you be specific and send the exact link to the data you used? I saw many links in your first link.</div><div><br></div><div>3. Did you attempt to contact the sources of the data to figure out the reasons for discrepancies?</div><div><br></div><div>The USA facts website states:</div><div>"they may not reflect the exact numbers reported state and local government organizations"</div><div><br></div><div>So perhaps you just stumbled on some data that will be fixed later.</div><div><br></div><div>I am being cautious before jumping to conclusions. This has to be studied in more detail to reach conclusions. However, I see your point that the data consistency issue is confusing at the least. </div><div><br></div><div>I will set up time to meet in private email.</div><div><br></div><div>Thank you for drawing our attention to another case of potential data issues.</div><div><br></div><div>           Jacob,</div><div><br></div><div><br></div><div><br></div><div><br></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Fri, Apr 2, 2021 at 12:56 AM Tingting Tang <<a href="mailto:ttang2@sdsu.edu">ttang2@sdsu.edu</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr"><div>Hi, Jacob,</div><div><br></div><div>I create this figure using the data from the websites I mentioned. They are numbers of new cases per day reported by these websites. I also noticed that different websites sometimes have different meaning for "daily new cases" which makes the matter even more confusing. The following website contains this image <a href="https://www.notion.so/Two-websites-with-consistent-data-where-one-draw-from-the-other-2e54d94d9d474c36837cb48327963ba7" target="_blank">https://www.notion.so/Two-websites-with-consistent-data-where-one-draw-from-the-other-2e54d94d9d474c36837cb48327963ba7</a></div><div><br></div><div>I'd be happy to have a video chat sometime about the credibility of data.</div><div><br></div><div>Thanks,</div><div>Tingting</div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Thu, Apr 1, 2021 at 9:02 PM Jacob Barhak <<a href="mailto:jacob.barhak@gmail.com" target="_blank">jacob.barhak@gmail.com</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr">Hi Tingting,<div><br></div><div>Did you create those plots? </div><div><br></div><div>It would be very interesting to start another discussion topic at the credibility mailing list and see how many more people noticed differences between data sources.</div><div><br></div><div>However, the maling list will reject archiving images and large files - its an old malign list tool we are using.</div><div><br></div><div>Nevertheless, if you have a link to this image stored elsewhere accessible like google drive, it would be nice to share your experience with the working group. </div><div><br></div><div>I was looking at your plot and data sources and was wondering if you are showing hospitalisation data or diagnosed data?</div><div><br></div><div>It seems that data needs interpretation - Lucas and I are working on this aspect - if you are interested you can join the effort - I am looking for experts to interpret data from a human perspective to add to models. If this interests you, let me know and we will schedule a video call so I can better explain.</div><div><br></div><div>Meanwhile, thank you for your email and it will be nice if you share this with the entire group.</div><div><br></div><div>             Jacob</div><div><br></div><div><br></div><div><br></div><div><br></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Thu, Apr 1, 2021 at 6:53 PM Tingting Tang <<a href="mailto:ttang2@sdsu.edu" target="_blank">ttang2@sdsu.edu</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr"><div>Hi, Jacob,</div><div><br></div><div>This example prompts me to link the credibility of data sources of some websites I have been watching. In particular, I have been checking the covid tracking data for imperial county, ca, for over a month at different websites: local government (<a href="http://icphd.com" target="_blank">icphd.com</a>), usa fact, <a href="http://1point3acres.com" target="_blank">1point3acres.com</a>, california open data portal(<a href="https://data.chhs.ca.gov/dataset/covid-19-hospital-data" target="_blank">https://data.chhs.ca.gov/dataset/covid-19-hospital-data</a>) etc. <br></div><div><br></div><div>There seems to be quite a bit of inconsistency with these data sources in case reporting. A quick glance of the comparison between california open data portal and the usa fact data which claims they draw data from the prior is shown below. You can ignore the labels as they are signifying the loosen and tighten of the local government regulations. <br></div><div><br></div><div>If you see fit I can provide more information to add this as another issue with data consistency and credibility as well. <br></div><div><br></div><div></div></div></blockquote></div></blockquote></div><br>
</blockquote></div></div>