<div dir="ltr"><div>Hi, Jacob,</div><div><br></div><div>I create this figure using the data from the websites I mentioned. They are numbers of new cases per day reported by these websites. I also noticed that different websites sometimes have different meaning for "daily new cases" which makes the matter even more confusing. The following website contains this image <a href="https://www.notion.so/Two-websites-with-consistent-data-where-one-draw-from-the-other-2e54d94d9d474c36837cb48327963ba7">https://www.notion.so/Two-websites-with-consistent-data-where-one-draw-from-the-other-2e54d94d9d474c36837cb48327963ba7</a></div><div><br></div><div>I'd be happy to have a video chat sometime about the credibility of data.</div><div><br></div><div>Thanks,</div><div>Tingting</div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Thu, Apr 1, 2021 at 9:02 PM Jacob Barhak <<a href="mailto:jacob.barhak@gmail.com">jacob.barhak@gmail.com</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr">Hi Tingting,<div><br></div><div>Did you create those plots? </div><div><br></div><div>It would be very interesting to start another discussion topic at the credibility mailing list and see how many more people noticed differences between data sources.</div><div><br></div><div>However, the maling list will reject archiving images and large files - its an old malign list tool we are using.</div><div><br></div><div>Nevertheless, if you have a link to this image stored elsewhere accessible like google drive, it would be nice to share your experience with the working group. </div><div><br></div><div>I was looking at your plot and data sources and was wondering if you are showing hospitalisation data or diagnosed data?</div><div><br></div><div>It seems that data needs interpretation - Lucas and I are working on this aspect - if you are interested you can join the effort - I am looking for experts to interpret data from a human perspective to add to models. If this interests you, let me know and we will schedule a video call so I can better explain.</div><div><br></div><div>Meanwhile, thank you for your email and it will be nice if you share this with the entire group.</div><div><br></div><div>             Jacob</div><div><br></div><div><br></div><div><br></div><div><br></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Thu, Apr 1, 2021 at 6:53 PM Tingting Tang <<a href="mailto:ttang2@sdsu.edu" target="_blank">ttang2@sdsu.edu</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr"><div>Hi, Jacob,</div><div><br></div><div>This example prompts me to link the credibility of data sources of some websites I have been watching. In particular, I have been checking the covid tracking data for imperial county, ca, for over a month at different websites: local government (<a href="http://icphd.com" target="_blank">icphd.com</a>), usa fact, <a href="http://1point3acres.com" target="_blank">1point3acres.com</a>, california open data portal(<a href="https://data.chhs.ca.gov/dataset/covid-19-hospital-data" target="_blank">https://data.chhs.ca.gov/dataset/covid-19-hospital-data</a>) etc. <br></div><div><br></div><div>There seems to be quite a bit of inconsistency with these data sources in case reporting. A quick glance of the comparison between california open data portal and the usa fact data which claims they draw data from the prior is shown below. You can ignore the labels as they are signifying the loosen and tighten of the local government regulations. <br></div><div><br></div><div>If you see fit I can provide more information to add this as another issue with data consistency and credibility as well. <br></div><div><br></div><div><br><br><img src="cid:ii_kmzj797g1" alt="image.png" width="480" height="199"><br><br><br></div><div>Thanks,</div><div>Tingting<br></div><div><br></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Thu, Apr 1, 2021 at 6:31 AM Jacob Barhak <<a href="mailto:jacob.barhak@gmail.com" target="_blank">jacob.barhak@gmail.com</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr">Greetings subgroups,<div><br></div><div>With the help of William Waites we were able to contact a Singapore Ministry of Health Official.</div><div><br></div><div>The official was not able to comment on the quality of data in:  <a href="https://co.vid19.sg/singapore/" target="_blank">https://co.vid19.sg/singapore/</a></div><div><br></div><div>To remind you, we tried to contact the data curators of this data multiple times in different ways and were unable to do it. Therefore I would personally classify this data source as "use at your own risk" because:</div><div>1. There is no record on how this data was collected and if proper procedures</div><div>2. There is no legal information on reuse of the data</div><div>3. The only entity listed cannot be contacted to answer queries about the data</div><div>4. William found some defunct links </div><div><br></div><div>All of those elements are sufficient to put doubt regarding this data source.</div><div><br></div><div>For those interested in using the Singapore COVID-19 data, the Singapore Ministry of Health official pointed us to the official Singapore data source:</div><div><a href="https://www.moh.gov.sg/news-highlights/details/1-new-case-of-locally-transmitted-covid-19-infection_31_March_2021" target="_blank">https://www.moh.gov.sg/news-highlights/details/1-new-case-of-locally-transmitted-covid-19-infection_31_March_2021</a><br></div><div><br></div><div>You wil find a link there to historical data as well.</div><div><br></div><div>I will use this example as a data credibility test case and start a discussion on data credibility - our models are based on data and verified against data - the data sources should be as credible as possible and we should perhaps discuss ways to assess credibility of new data. This is one example and many others may follow in future years since data curation is so easy today. I believe that addressing this issue in the subgroup will help us create better models based on better data.</div><div><br></div><div>               Jacob</div><div><br></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Sun, Mar 28, 2021 at 4:28 PM Jacob Barhak <<a href="mailto:jacob.barhak@gmail.com" target="_blank">jacob.barhak@gmail.com</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr">Greetings subgroups.<div><br></div><div>Lucas Boettcher has located a very detailed source of data for CVOID-19:</div><div><a href="https://co.vid19.sg/singapore/" target="_blank">https://co.vid19.sg/singapore/</a><br></div><div><br></div><div>However, the data is missing all sorts of legal details such as license or even a  copyright statement, as well as information on how the data was collected. So this data may not be officially usable regardless of potential benefit. </div><div><br></div><div>We attempted to contact the only entity that is associated with the data:</div><div><a href="https://www.upcodeacademy.com/contact" target="_blank">https://www.upcodeacademy.com/contact</a><br></div><div><br></div><div>We have tried multiple attempts by now using different methods and there is no response. </div><div><br></div><div>In hope we can clarify the data origins and usage terms, I am approaching this mailing list in hope someone has some contacts in Singapore that can help.</div><div><br></div><div>If you have a contact in Singapore, please let Lucas and me know. Hopefully the working group can help with this matter.</div><div><br></div><div>            Jacob</div><div><br></div><div><br></div></div>
</blockquote></div>
_______________________________________________<br>
Vp-reproduce-subgroup mailing list<br>
<a href="mailto:Vp-reproduce-subgroup@lists.simtk.org" target="_blank">Vp-reproduce-subgroup@lists.simtk.org</a><br>
<a href="https://lists.simtk.org/mailman/listinfo/vp-reproduce-subgroup" rel="noreferrer" target="_blank">https://lists.simtk.org/mailman/listinfo/vp-reproduce-subgroup</a><br>
</blockquote></div><br clear="all"><br>-- <br><div dir="ltr"><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div>Tingting Tang</div><div>Assistant Professor</div><div>San Diego State University Imperial Valley</div><div><div>
Office: FOBE 110 <br></div><div>Phone: 760-768-5531</div><div>720 Heber Ave</div>Calexico, CA 92231</div></div></div></div></div></div></div>
</blockquote></div>
</blockquote></div><br clear="all"><br>-- <br><div dir="ltr" class="gmail_signature"><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div>Tingting Tang</div><div>Assistant Professor</div><div>San Diego State University Imperial Valley</div><div><div>
Office: FOBE 110 <br></div><div>Phone: 760-768-5531</div><div>720 Heber Ave</div>Calexico, CA 92231</div></div></div></div></div></div></div>