<div dir="ltr">Hi Andreas,<br><div class="gmail_quote"><div dir="ltr"><br></div><div dir="ltr"><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><br class="inbox-inbox-Apple-interchange-newline">On Fri, Mar 16, 2018 at 05:48:35PM +0100, Andreas Tille wrote:<br><br>> > I included a genome sequence from NCBI as test data. Should I indicate the<br>> > source of this data somewhere in the package (e.g., in Readme.tests)?<br>><br>> I think the best place would be debian/copyright since a data file<br>> should come with a license.  I would say something like<br>><br>><br>> Files: debian/tests/test-data<br>> Copyright: yyyy-yyyy Copyright-Owner<br>> License:<br>> Comment:<br>>   This file was obtained by<br>>     wget URL<br><br>Please let us know here on the list if you spot any problem to fill<br>in the details.</blockquote></div><div dir="ltr"><br></div><div>I have tried to find the information that should be placed in d/copyright, but unfortunately, I don't have any experience with this kind of stuff. So this is what I have found so far:</div><div><ul><li>I downloaded the test sequence from the Ensemble Bacteria, which is an online database of EMBL-EBI. At the bottom of the sequence <a href="http://bacteria.ensembl.org/Candidatus_carsonella_ruddii_dc/Info/Index" target="_blank">page</a>, it is indicated "Ensembl Bacteria release 38 - January 2018 © EMBL-EBI". I couldn't find any license they may have for the data, except that <a href="https://www.ebi.ac.uk/about/terms-of-use" target="_blank">Terms of Use</a> states: "EMBL-EBI itself places no additional restrictions on the use or redistribution of the data available via its online services other than those provided by the original data owners."</li><li>At first, the sequence was deposited in the GenBank database (as said in this <a href="http://www.cell.com/current-biology/fulltext/S0960-9822(13)00752-5">paper</a>). I didn't find if the GenBank has copyright, but they say <a href="https://www.ncbi.nlm.nih.gov/genbank/">here</a>: "<span style="font-size:13px;font-family:arial,helvetica,clean,sans-serif">NCBI places no restrictions on the use or distribution of the GenBank data. </span><span style="font-size:13px;font-family:arial,helvetica,clean,sans-serif">However, some submitters may claim patent, copyright, or other intellectual property rights in all or a portion of the data they have submitted.</span>"</li><li>Finally, I have found that the sequence itself has no patent (this had to be indicated in the field LOCUS of the<a href="https://www.ncbi.nlm.nih.gov/nuccore/CP003467?report=genbank"> GenBank file</a> as PAT). I suspect the sequence has no copyright as well, although I can't find a confirmation.</li></ul></div><div>Could you, please, point me in the right direction. I feel like I'm getting stuck.</div><div><br></div><div>Thank you,</div><div>Liubov</div></div></div>